Kunlun Wanwei lance Matrix-Zero, un modèle mondial : première création chinoise de scènes 3D et de vidéos interactives

Le 14 février 2025, le groupe Kunlun Wanwei a officiellement lancé le modèle mondial Matrix-Zero, marquant une étape importante pour la Chine dans le domaine de l'intelligence spatiale. Matrix-Zero comprend deux sous-modèles : un grand modèle de génération de scènes 3D et un grand modèle de génération de vidéos interactives, visant à réinventer le mode de création de contenu numérique grâce à l'IA et à stimuler l'innovation dans les secteurs de la production cinématographique, du développement de jeux et de l'intelligence incarnée.
Fei-Fei Li, professeure à l'université de Stanford et surnommée la « marraine de l'IA », et son équipe ont récemment publié une étude sur « l'intelligence spatiale » des grands modèles multimodaux. Cette étude révèle que ces modèles possèdent déjà des capacités préliminaires en matière de mémorisation et de rappel spatial, et montrent un potentiel pour former des modèles du monde partiels. L'équipe de recherche a développé VSI-Bench, un outil d'évaluation des capacités d'intelligence visuo-spatiale, contenant plus de 5000 paires de questions-réponses de haute qualité basées sur 288 vidéos réelles. Les vidéos testées couvrent les espaces de vie, les lieux professionnels et les environnements industriels, et concernent plusieurs emplacements géographiques.