VideoWorld
VideoWorld es un modelo generativo profundo que explora el aprendizaje de conocimiento a partir de videos sin etiquetas.
Producto ComúnVideoInteligencia ArtificialVisión por Computadora
VideoWorld es un modelo generativo profundo centrado en el aprendizaje de conocimiento complejo a partir de datos de entrada puramente visuales (videos sin etiquetas). A través de la tecnología de generación de video autorregresiva, explora cómo aprender reglas de tareas, razonamiento y capacidad de planificación solo con información visual. La principal ventaja del modelo reside en su innovador Modelo Dinámico Latente (MDL), capaz de representar eficientemente cambios visuales en múltiples pasos, lo que mejora significativamente la eficiencia del aprendizaje y la adquisición de conocimiento. VideoWorld ha demostrado un excelente rendimiento en tareas de Go en video y control robótico, mostrando su poderosa capacidad de generalización y su habilidad para aprender tareas complejas. La investigación detrás del modelo se inspira en la forma en que los organismos vivos aprenden conocimiento a través de la visión, no del lenguaje, con el objetivo de abrir nuevas vías para la adquisición de conocimiento en la inteligencia artificial.
VideoWorld Situación del tráfico más reciente
Total de visitas mensuales
2314
Tasa de rebote
67.91%
Páginas promedio por visita
1.4
Duración promedio de la visita
00:00:44