Récemment, AlphaGeometry2, un système d'IA développé par Google DeepMind, a surpassé la moyenne des scores des médaillés d'or aux Olympiades Internationales de Mathématiques (OIM) en matière de résolution de problèmes de géométrie. AlphaGeometry2 est une version améliorée du système AlphaGeometry lancé par DeepMind l'année dernière. Dans leurs dernières recherches, l'équipe a indiqué que le système pouvait résoudre 84 % des problèmes de géométrie des OIM des 25 dernières années.
Pourquoi DeepMind s'intéresse-t-il à une compétition de mathématiques de niveau lycée ? Les chercheurs estiment que de nouvelles méthodes pour résoudre des problèmes de géométrie complexes pourraient être la clé pour améliorer les capacités de l'IA, notamment en géométrie euclidienne. Démontrer des théorèmes mathématiques nécessite des capacités de raisonnement et la capacité de choisir les étapes de résolution appropriées. DeepMind croit que ces capacités de résolution de problèmes pourraient être cruciales pour le développement futur de modèles d'IA universels.
Source : Image générée par IA, fournie par Midjourney
Cet été, DeepMind a également présenté un système combinant AlphaGeometry2 et AlphaProof (un modèle d'IA pour le raisonnement mathématique formel). Ce système a résolu quatre des six problèmes des épreuves de sélection des OIM 2024. Au-delà des problèmes de géométrie, cette méthode pourrait s'étendre à d'autres domaines des mathématiques et des sciences, et même aider à traiter des calculs d'ingénierie complexes.
Le cœur d'AlphaGeometry2 comprend des modèles linguistiques de la famille Gemini de Google et un « moteur symbolique ». Le modèle Gemini aide le moteur symbolique à utiliser les règles mathématiques pour déduire les solutions aux problèmes. Son processus de travail est le suivant : le modèle Gemini prédit quelles constructions (comme des points, des lignes, des cercles) pourraient être utiles pour résoudre le problème, puis le moteur symbolique effectue un raisonnement logique basé sur ces constructions. Après une série de recherches complexes, AlphaGeometry2 est capable de combiner les suggestions du modèle Gemini avec les principes connus pour obtenir une démonstration.
Bien qu'AlphaGeometry2 ait réussi à résoudre 42 des 50 problèmes des OIM, dépassant ainsi le score moyen des médaillés d'or, il présente encore certaines limitations. Par exemple, il ne peut pas résoudre des problèmes avec un nombre variable de points, des équations non linéaires et des inégalités. De plus, sur certains problèmes plus difficiles, les performances d'AlphaGeometry2 sont moins bonnes, ayant résolu seulement 20 des 29 problèmes.
Cette recherche a relancé le débat sur la question de savoir si les systèmes d'IA devraient être basés sur des opérations symboliques ou sur des réseaux neuronaux plus bio-inspirés. AlphaGeometry2 utilise une approche hybride, combinant des réseaux neuronaux et un moteur symbolique basé sur des règles. L'équipe de DeepMind souligne que, bien que les grands modèles linguistiques puissent générer des solutions partielles sans outils externes, dans le cas présent, le moteur symbolique reste un outil important pour les applications mathématiques.