LÉO

Agent polyvalent dans le monde 3D

Produit OrdinaireImageIntelligence artificielleMonde 3D
LÉO est un agent polyvalent multi-modalités et multi-tâches, basé sur un grand modèle linguistique, capable de percevoir, se localiser, raisonner, planifier et exécuter des tâches dans un environnement 3D. LÉO est entraîné en deux phases : (i) alignement visuel linguistique 3D et (ii) ajustement des instructions d'action visuelles linguistiques 3D. Nous avons soigneusement conçu et généré un vaste ensemble de données contenant des tâches multimodales au niveau des objets et des scènes, nécessitant une compréhension et une interaction approfondies du monde 3D. Grâce à des expériences rigoureuses, nous avons démontré les performances exceptionnelles de LÉO dans un large éventail de tâches, notamment le sous-titrage 3D, les questions-réponses, le raisonnement, la navigation et la manipulation robotique.
Ouvrir le site Web

LÉO Dernière situation du trafic

Nombre total de visites mensuelles

19

Taux de rebond

37.17%

Nombre moyen de pages par visite

1.0

Durée moyenne de la visite

00:00:00

LÉO Tendance des visites

LÉO Distribution géographique des visites

Pas de données de distribution géographique disponibles

LÉO Sources de trafic

LÉO Alternatives