LEO

Agente multifuncional em mundos 3D

Produto ComumImagemInteligência ArtificialMundo 3D
LEO é um agente multifuncional, multi-modal e multitarefa baseado em um grande modelo de linguagem, capaz de perceber, localizar, raciocinar, planejar e executar tarefas em mundos 3D. O LEO é treinado em duas etapas: (i) alinhamento de linguagem e visão 3D e (ii) ajuste de instruções de ação de linguagem e visão 3D. Desenvolvemos e geramos cuidadosamente um conjunto de dados em larga escala contendo tarefas multimodais em nível de objeto e de cena, exigindo uma compreensão e interação profunda com o mundo 3D. Por meio de experimentos rigorosos, demonstramos o excelente desempenho do LEO em uma ampla gama de tarefas, incluindo legendagem 3D, perguntas e respostas, raciocínio, navegação e manipulação robótica.
Abrir Site

LEO Situação do Tráfego Mais Recente

Total de Visitas Mensais

19

Taxa de Rejeição

37.17%

Média de Páginas por Visita

1.0

Duração Média da Visita

00:00:00

LEO Tendência de Visitas

LEO Distribuição Geográfica das Visitas

Sem Dados de Distribuição Geográfica

LEO Fontes de Tráfego

LEO Alternativas