LEO

Agente polivalente en el mundo 3D

Producto ComúnImagenInteligencia ArtificialMundo 3D
LEO es un agente polivalente multi-modal y multi-tarea basado en un modelo de lenguaje extenso, capaz de percibir, localizar, razonar, planificar y ejecutar tareas en un mundo 3D. LEO se entrena en dos fases: (i) Alineación visual-lingüística 3D y (ii) Ajuste de instrucciones de acción visual-lingüística 3D. Hemos cuidadosamente diseñado y generado un conjunto de datos a gran escala que contiene tareas multimodales a nivel de objeto y escena, que requieren una comprensión e interacción profunda con el mundo 3D. A través de rigurosos experimentos, demostramos el excelente rendimiento de LEO en una amplia gama de tareas, incluyendo subtitulado 3D, preguntas y respuestas, razonamiento, navegación y manipulación robótica.
Abrir sitio web

LEO Situación del tráfico más reciente

Total de visitas mensuales

19

Tasa de rebote

37.17%

Páginas promedio por visita

1.0

Duración promedio de la visita

00:00:00

LEO Tendencia de visitas

LEO Distribución geográfica de las visitas

No hay datos de distribución geográfica disponibles

LEO Fuentes de tráfico

LEO Alternativas