最近、Google DeepMindが開発したAIシステム「AlphaGeometry2」が、国際数学オリンピック(IMO)金メダリストの平均点を上回る幾何学問題解決能力を示しました。AlphaGeometry2は、昨年発表されたAlphaGeometryシステムの改良版で、最新の研究によると、過去25年間のIMO幾何学問題の84%を解けることが明らかになっています。
では、なぜDeepMindは高校生の数学コンテストに注目しているのでしょうか?研究者によると、複雑な幾何学問題を解く新しい方法は、特にユークリッド幾何学において、AI能力向上のための重要な鍵となる可能性があると考えています。数学の定理証明には推論能力と適切な解法を選択する能力が必要であり、DeepMindはこれらの問題解決能力が将来の汎用AIモデルの発展に極めて重要だと考えています。
画像注記:AI生成画像、画像ライセンス提供元Midjourney
今年の夏、DeepMindはAlphaGeometry2とAlphaProof(正式な数学的推論を行うAIモデル)を組み合わせたシステムを発表しました。このシステムは、2024年IMO予選で6問中4問を解きました。幾何学問題以外にも、この手法は数学や科学の他の分野にも応用でき、複雑な工学計算の処理にも役立つ可能性があります。
AlphaGeometry2の中核には、Google Geminiファミリーの言語モデルと「記号エンジン」が含まれています。Geminiモデルは、記号エンジンが数学規則を利用して問題の解決策を導き出すのを支援します。そのワークフローは、Geminiモデルが問題解決に役立つ可能性のある構成要素(点、線、円など)を予測し、その後、記号エンジンがこれらの構成要素に基づいて論理的推論を行うというものです。一連の複雑な探索を経て、AlphaGeometry2はGeminiモデルの提案と既知の原則を組み合わせ、証明を導き出します。
AlphaGeometry2はIMOの50問中42問を解き、金メダリストの平均点を上回りましたが、変数の数が不定な点、非線形方程式、不等式などは解けないなど、いくつかの限界があります。また、より難しい問題では、29問中20問しか解けず、その性能は必ずしも完璧ではありませんでした。
この研究は、AIシステムが記号操作に基づくべきか、それともより脳に似たニューラルネットワークに基づくべきかという議論を再び引き起こしました。AlphaGeometry2は、ニューラルネットワークと規則に基づく記号エンジンのハイブリッドアプローチを採用しています。DeepMindのチームは、大規模言語モデルは外部ツールなしで部分的な解決策を生成できる可能性がありますが、現状では記号エンジンが数学的応用において重要なツールであると指摘しています。