VideoWorld
VideoWorld est un modèle génératif profond explorant l’apprentissage de connaissances à partir de vidéos non annotées.
Produit OrdinaireVidéoIntelligence artificielleVision par ordinateur
VideoWorld est un modèle génératif profond axé sur l’apprentissage de connaissances complexes à partir de données visuelles brutes (vidéos non annotées). Grâce à une technique de génération vidéo auto-récursive, il explore comment apprendre des règles de tâches, le raisonnement et la planification à partir d’informations visuelles uniquement. Son principal atout réside dans son modèle dynamique latent (LDM) innovant, capable de représenter efficacement les changements visuels multi-étapes, améliorant ainsi considérablement l’efficacité de l’apprentissage et l’acquisition de connaissances. VideoWorld excelle dans des tâches de jeu de go vidéo et de contrôle robotique, démontrant ainsi ses capacités de généralisation et d’apprentissage de tâches complexes. Ses recherches s’inspirent de la façon dont les organismes vivants apprennent par la vue sans le langage, visant à ouvrir de nouvelles voies pour l’acquisition de connaissances en intelligence artificielle.
VideoWorld Dernière situation du trafic
Nombre total de visites mensuelles
2314
Taux de rebond
67.91%
Nombre moyen de pages par visite
1.4
Durée moyenne de la visite
00:00:44