Récemment, l'équipe Verses a réalisé une prouesse remarquable avec son agent intelligent Genius dans le jeu classique Pong. En utilisant seulement 10% des données et 2 heures d'entraînement, il a surpassé les meilleurs joueurs humains et d'autres modèles d'IA. Cette avancée révolutionnaire marque une nouvelle étape dans le domaine de l'IA et préfigure les futures orientations du développement des agents intelligents.
Le succès de l'agent intelligent Genius repose sur son concept de conception unique. Contrairement aux grands modèles traditionnels, Genius est 4 fois plus petit que le modèle IRIS (SOTA) et peut fonctionner sur un MacBook équipé d'une simple puce M1. L'inspiration des chercheurs provient d'une expérience menée il y a quatre ans : des scientifiques ont observé qu'un "cerveau sur une puce" cultivé pouvait apprendre à jouer à Pong en seulement 5 minutes, ce qui les a amenés à réfléchir à l'imitation du fonctionnement du cerveau humain.
Source : Image générée par IA, fournie par Midjourney
L'équipe Verses estime que les agents intelligents basés sur les grands modèles traditionnels présentent de graves lacunes en matière de raisonnement logique. Les modèles existants s'appuient davantage sur la mémorisation des étapes de raisonnement des données d'entraînement, manquant de véritable proactivité et de curiosité. L'agent intelligent Genius utilise le concept de moteur cognitif, ce qui lui confère non seulement des capacités de cognition, de raisonnement et de prise de décision, mais aussi une capacité d'apprentissage actif.
Lors de tests comparatifs avec IRIS et d'autres modèles d'IA, Genius a démontré une capacité d'apprentissage remarquable. Les chercheurs ont entraîné Genius pendant 2 heures avec 10 000 étapes de données de jeu, et les résultats ont montré qu'il surpassait IRIS, entraîné pendant deux jours. Le succès de Genius ne réside pas seulement dans sa rapidité d'apprentissage, mais aussi dans sa proactivité dans le jeu. Par exemple, dans le jeu de Pong, Genius a réussi à inverser la tendance et à gagner même lorsqu'il était en retard, un phénomène qui ne s'est pas produit lors de l'entraînement d'IRIS.
Cependant, les chercheurs rappellent que, malgré les résultats encourageants de Genius, il n'existe pas encore de norme unifiée permettant de mesurer complètement les performances de l'AGI. Des tests diversifiés sont nécessaires pour vérifier son adaptabilité et sa fiabilité dans différents domaines.
Ces résultats de recherche non seulement stimulent le développement des agents intelligents de l'IA, mais offrent également de nouvelles pistes et méthodes pour l'exploration de l'intelligence artificielle future.
Adresse de l'article : https://arxiv.org/pdf/2410.05229