LEO
Agente multifuncional em mundos 3D
Produto ComumImagemInteligência ArtificialMundo 3D
LEO é um agente multifuncional, multi-modal e multitarefa baseado em um grande modelo de linguagem, capaz de perceber, localizar, raciocinar, planejar e executar tarefas em mundos 3D. O LEO é treinado em duas etapas: (i) alinhamento de linguagem e visão 3D e (ii) ajuste de instruções de ação de linguagem e visão 3D. Desenvolvemos e geramos cuidadosamente um conjunto de dados em larga escala contendo tarefas multimodais em nível de objeto e de cena, exigindo uma compreensão e interação profunda com o mundo 3D. Por meio de experimentos rigorosos, demonstramos o excelente desempenho do LEO em uma ampla gama de tarefas, incluindo legendagem 3D, perguntas e respostas, raciocínio, navegação e manipulação robótica.
LEO Situação do Tráfego Mais Recente
Total de Visitas Mensais
19
Taxa de Rejeição
37.17%
Média de Páginas por Visita
1.0
Duração Média da Visita
00:00:00
LEO Tendência de Visitas
LEO Distribuição Geográfica das Visitas
Sem Dados de Distribuição Geográfica