Le dernier système d'IA d'AlphaGeometry2, développé par le laboratoire de recherche Google DeepMind, excelle dans la résolution de problèmes de géométrie, surpassant même la moyenne des médaillés d'or aux Olympiades internationales de mathématiques (OIM). Considéré comme une version améliorée d'AlphaGeometry, les chercheurs affirment qu'AlphaGeometry2 est capable de résoudre 84 % des problèmes de géométrie des OIM des 25 dernières années.

image.png

Pourquoi DeepMind s'intéresse-t-il à ces concours de mathématiques de niveau lycée ? Ils estiment que la recherche de nouvelles méthodes pour résoudre des problèmes de géométrie complexes, notamment en géométrie euclidienne, pourrait être la clé pour améliorer les capacités de l'IA. Démontrer des théorèmes mathématiques ou expliquer pourquoi un théorème (comme le théorème de Pythagore) est vrai nécessite un raisonnement logique et la capacité de choisir parmi plusieurs étapes possibles. Si la théorie de DeepMind se confirme, ces capacités de résolution de problèmes seront cruciales pour les futurs modèles d'IA générale.

Cet été, DeepMind a présenté un système combinant AlphaGeometry2 et le modèle d'IA de raisonnement mathématique AlphaProof, qui a résolu quatre des six problèmes des OIM 2024. Au-delà des problèmes de géométrie, cette approche pourrait être étendue à d'autres domaines des mathématiques et des sciences, tels que les calculs d'ingénierie complexes.

Les composants centraux d'AlphaGeometry2 incluent un modèle linguistique de la série Gemini de Google et un « moteur symbolique ». Le modèle Gemini aide le moteur symbolique à déduire des solutions possibles au problème en utilisant les règles mathématiques. Les problèmes de géométrie des OIM reposent généralement sur des figures nécessitant l'ajout de « constructions », telles que des points, des lignes ou des cercles. Le modèle Gemini d'AlphaGeometry2 est capable de prédire quelles constructions pourraient être utiles pour résoudre le problème.

Il est important de noter qu'AlphaGeometry2 a été entraîné sur plus de 300 millions de théorèmes et de preuves synthétiques générés par DeepMind lui-même pour résoudre les problèmes des OIM. L'équipe de recherche a sélectionné 45 problèmes de géométrie des OIM des 25 dernières années et les a étendus pour former un ensemble de 50 problèmes. AlphaGeometry2 a réussi à en résoudre 42, dépassant ainsi le score moyen des médaillés d'or.

Cependant, AlphaGeometry2 présente encore certaines limitations, par exemple, il ne peut pas résoudre les problèmes comportant un nombre variable de points, des équations non linéaires et des inégalités. Néanmoins, cette recherche suscite un débat sur la question de savoir si les systèmes d'IA doivent être basés sur des opérations symboliques ou sur des réseaux neuronaux. AlphaGeometry2 utilise une approche hybride, combinant des réseaux neuronaux et un moteur symbolique basé sur des règles.

Le succès d'AlphaGeometry2 ouvre de nouvelles perspectives pour le développement futur de l'IA générale. Bien qu'il ne soit pas encore totalement autonome, les recherches de l'équipe DeepMind suggèrent que des modèles d'IA plus autonomes pourraient voir le jour à l'avenir.

Lien vers l'article : https://arxiv.org/pdf/2502.03544

Points clés :

📊 AlphaGeometry2 est capable de résoudre 84 % des problèmes de géométrie des OIM des 25 dernières années, surpassant le score moyen des médaillés d'or.

🔍 Ce système combine des réseaux neuronaux et un moteur symbolique, utilisant une approche hybride pour résoudre des problèmes mathématiques complexes.

📈 DeepMind espère faire progresser la recherche sur l'IA générale plus puissante en résolvant des problèmes de géométrie.