Das neueste KI-System von Googles DeepMind-Forschungslabor, AlphaGeometry2, zeigt außergewöhnliche Fähigkeiten beim Lösen geometrischer Probleme und übertrifft den Durchschnitt der Goldmedaillengewinner der Internationalen Mathematik-Olympiade (IMO).
Warum konzentriert sich DeepMind auf einen solchen Mathematik-Wettbewerb für die Oberstufe? Die Forscher glauben, dass die Suche nach neuen Methoden zur Lösung komplexer geometrischer Probleme, insbesondere in der euklidischen Geometrie, der Schlüssel zur Verbesserung der KI-Fähigkeiten sein könnte. Das Beweisen mathematischer Sätze oder das Erklären, warum ein Satz (wie der Satz des Pythagoras) gilt, erfordert logisches Denken und die Fähigkeit, aus mehreren möglichen Schritten auszuwählen. Wenn DeepMinds Theorie stimmt, wären diese Fähigkeiten zur Problemlösung für zukünftige universelle KI-Modelle von großer Bedeutung.
Im Sommer präsentierte DeepMind ein System, das AlphaGeometry2 mit dem mathematischen KI-Inferenzmodell AlphaProof kombiniert. Dieses System löste vier der sechs Probleme der IMO 2024. Diese Methode lässt sich neben geometrischen Problemen auch auf andere mathematische und wissenschaftliche Bereiche wie komplexe technische Berechnungen erweitern.
Zu den Kernkomponenten von AlphaGeometry2 gehören ein Sprachmodell aus der Google Gemini-Serie und eine „symbolische Engine“. Das Gemini-Modell hilft der symbolischen Engine, durch mathematische Regeln praktikable Lösungen für das Problem abzuleiten. Geometrische IMO-Probleme basieren oft auf Grafiken, bei denen „Konstruktionen“ wie Punkte, Linien oder Kreise hinzugefügt werden müssen. Das Gemini-Modell von AlphaGeometry2 kann vorhersagen, welche Konstruktionen hilfreich sein könnten, um das Problem zu lösen.
Bemerkenswert ist, dass AlphaGeometry2 bei der Lösung von IMO-Problemen mit synthetischen Daten trainiert wurde, die aus über 300 Millionen von DeepMind selbst generierten Theoremen und Beweisen bestehen. Das Forschungsteam wählte 45 geometrische Probleme aus den letzten 25 Jahren der IMO aus und erweiterte sie zu einem Satz von 50 Problemen. AlphaGeometry2 löste 42 davon erfolgreich und übertraf damit die durchschnittliche Punktzahl der Goldmedaillengewinner.
AlphaGeometry2 hat jedoch auch einige Einschränkungen. So kann es beispielsweise keine Probleme lösen, die eine variable Anzahl von Punkten, nichtlineare Gleichungen und Ungleichungen aufweisen. Trotzdem wirft diese Forschung die Frage auf, ob KI-Systeme auf symbolischen Operationen oder neuronalen Netzen basieren sollten. AlphaGeometry2 verwendet einen hybriden Ansatz, der neuronale Netze und eine regelbasierte symbolische Engine kombiniert.
Der Erfolg von AlphaGeometry2 bietet neue Perspektiven für die zukünftige Entwicklung universeller KI. Obwohl es derzeit noch nicht vollständig autark ist, zeigen die Ergebnisse des DeepMind-Teams, dass in Zukunft möglicherweise mehr selbstständige KI-Modelle entstehen werden.
Link zur Veröffentlichung: https://arxiv.org/pdf/2502.03544
Wichtigste Punkte:
📊 AlphaGeometry2 kann 84 % der geometrischen Probleme der IMO der letzten 25 Jahre lösen und übertrifft die durchschnittliche Punktzahl der Goldmedaillengewinner.
🔍 Das System kombiniert neuronale Netze und eine symbolische Engine und verwendet einen hybriden Ansatz zur Lösung komplexer mathematischer Probleme.
📈 DeepMind hofft, durch die Lösung geometrischer Probleme den Fortschritt bei der Entwicklung leistungsfähigerer universeller KI zu fördern.