Une percée remarquable en matière d'IA a récemment suscité un vif intérêt dans le monde du jeu vidéo et de la technologie. Une équipe de recherche a réussi à développer un modèle d'IA appelé DIAMOND (Diffusion for World Modelling), capable de simuler une version simplifiée de Counter-Strike: Global Offensive (CS:GO) au sein d'un réseau neuronal. Cette innovation démontre non seulement l'énorme potentiel de l'IA dans la simulation de jeux vidéo, mais ouvre également de nouvelles perspectives pour la construction de mondes virtuels futurs.
L'un des points forts du modèle DIAMOND est son incroyable efficacité. Avec une seule carte graphique Nvidia RTX 3090, le modèle peut exécuter la simulation CS:GO à une vitesse de 10 images par seconde. Plus impressionnant encore, l'équipe de recherche n'a utilisé que 87 heures de données de jeu CS:GO pour entraîner le modèle, soit seulement 0,5 % des données utilisées par un projet similaire, GameNGen. Avec une quantité de données aussi limitée, produire une simulation de jeu aussi impressionnante témoigne de la puissance du modèle DIAMOND.
La technologie centrale de DIAMOND repose sur l'architecture Transformer. Il traite les mouvements du joueur comme des « jetons » (tokens), semblables aux mots dans une phrase. En prédisant ces jetons, le modèle apprend à anticiper le prochain mouvement en fonction des actions précédentes. Cette méthode innovante, initialement appliquée aux jeux Atari, a été migrée avec succès vers l'environnement plus complexe de CS:GO.
Le chercheur Eloi Alonso a présenté les capacités du modèle sur les réseaux sociaux. Dans la vidéo, les joueurs interagissent avec l'environnement CS:GO simulé à l'aide d'un clavier et d'une souris. La simulation inclut non seulement les interactions des joueurs, les mécanismes des armes et autres éléments de base, mais aussi des effets physiques environnementaux complexes, affichant un réalisme étonnant.
Cependant, le modèle DIAMOND présente encore des limitations et des défauts évidents. Par exemple, comme le modèle ne comprend pas parfaitement les mécanismes de gravité et de détection de collision du moteur Source, les joueurs peuvent sauter indéfiniment. De plus, si les joueurs s'écartent des chemins habituels des données d'entraînement, la simulation s'effondre. Ces problèmes mettent en évidence les défis liés à la simulation par IA de mondes de jeu complexes.
L'équipe de recherche est optimiste quant au développement futur de DIAMOND. Elle estime que l'augmentation de la quantité de données et de la puissance de calcul permettra d'améliorer les performances du modèle. À plus long terme, elle espère que cette technologie permettra de développer des modèles d'IA capables de naviguer dans des environnements réels complexes.
Il est à noter que DIAMOND s'inspire du système GameNGen, développé conjointement par Google Research, Google DeepMind et l'Université de Tel Aviv. GameNGen est capable de simuler une partie du jeu DOOM classique à plus de 20 images par seconde sur une seule puce Google TPU.
Le code source du modèle DIAMOND est disponible sur GitHub pour les développeurs et les chercheurs souhaitant explorer cette technologie en profondeur. Cela permettra sans aucun doute de stimuler la création de nouvelles applications innovantes et d'accélérer le développement de la technologie de simulation de jeux vidéo par IA.
Bien que DIAMOND ait réalisé des progrès révolutionnaires dans la simulation de CS:GO, il met également en lumière les défis auxquels l'IA est confrontée pour reproduire des systèmes d'interaction complexes. Avec les progrès technologiques constants, nous pouvons nous attendre à des simulations de jeux vidéo par IA plus réalistes et fluides. Cela révolutionnera non seulement le développement de jeux vidéo, mais pourrait également apporter un soutien technique précieux aux domaines de la réalité virtuelle et des simulateurs d'entraînement.