Google a récemment annoncé la création d'une nouvelle équipe dédiée au développement de modèles d'intelligence artificielle (IA) capables de simuler le monde physique. Cette équipe sera dirigée par Tim Brooks, ancien co-responsable du modèle de génération vidéo Sora chez OpenAI. Brooks a déclaré sur la plateforme X que cette nouvelle équipe serait rattachée au laboratoire de recherche IA de Google, Google DeepMind.
Dans son annonce, Brooks a mentionné : « Les plans de DeepMind sont ambitieux, avec pour objectif de développer des modèles génératifs à grande échelle pour simuler le monde. » Il a également indiqué que l'équipe collaborerait avec les équipes Gemini, Veo et Genie de Google pour résoudre des « nouveaux problèmes cruciaux » et étendre l'échelle des modèles aux capacités de calcul les plus élevées. Gemini est la série phare de modèles IA de Google, principalement utilisée pour l'analyse d'images et la génération de texte, tandis que Veo est un modèle de génération vidéo développé par Google. Quant à Genie, il s'agit d'une tentative de modèle mondial de Google, capable de simuler en temps réel des jeux et des environnements 3D.
Selon Brooks, l'équipe développera des outils de « génération interactive en temps réel » et étudiera comment intégrer ses modèles aux modèles multimodaux existants tels que Gemini. La description du poste mentionne : « Nous pensons que la mise à l'échelle de la formation de l'IA basée sur des données vidéo et multimodales est une voie clé pour atteindre l'intelligence artificielle générale (IAG). » L'IAG désigne une intelligence artificielle capable d'effectuer toutes les tâches qu'un humain peut accomplir.
De nombreuses startups et grandes entreprises technologiques sont également à la recherche du développement de modèles mondiaux, telles que World Labs, dirigée par la célèbre chercheuse en IA Fei-Fei Lee, la startup israélienne Decart et Odyssey. Ces entreprises estiment que les modèles mondiaux futurs pourront être utilisés pour créer des médias interactifs, tels que des jeux vidéo et des films, ainsi que pour exécuter des simulations réelles, comme l'entraînement de robots.
Cependant, le secteur créatif a une opinion différente sur cette technologie. Une enquête récente du magazine Wired a révélé que des sociétés de développement de jeux vidéo comme Activision Blizzard utilisent l'IA pour réduire les coûts et améliorer l'efficacité de la production, mais cela a également entraîné de nombreux licenciements. Selon une étude du syndicat des animateurs de 2024, plus de 100 000 emplois dans l'industrie américaine du cinéma, de la télévision et de l'animation devraient être affectés par l'IA d'ici 2026.
Néanmoins, certaines startups émergentes dans le domaine de la modélisation mondiale, comme Odyssey, s'engagent à collaborer avec les professionnels de la création plutôt qu'à les remplacer. Il reste à voir si Google adoptera la même approche. De plus, la question des droits d'auteur n'est pas encore résolue. L'entraînement de certains modèles mondiaux a pu utiliser des extraits de jeux vidéo en direct non autorisés, exposant les entreprises concernées à des risques de poursuites judiciaires.
Google affirme que l'entraînement de ses modèles sur YouTube est autorisé en vertu des conditions d'utilisation de la plateforme, mais n'a pas encore révélé les vidéos spécifiques utilisées.