Google DeepMind研究室が開発した最新のAIシステム、AlphaGeometry2は、幾何学の問題解決において卓越した能力を示し、国際数学オリンピック(IMO)の金メダリストの平均点を上回りました。このシステムはAlphaGeometryの改良版とされており、研究者によると、AlphaGeometry2は過去25年間のIMOの問題の84%を解くことができるそうです。

image.png

なぜDeepMindは高校生の数学コンテストに注目しているのでしょうか?彼らは、複雑な幾何学の問題、特にユークリッド幾何学の問題を解く新しい方法を見つけることが、AI能力向上への鍵だと考えています。数学の定理を証明したり、ピタゴラスの定理のような定理がなぜ成り立つのかを説明するには、論理的推論と、複数の可能性のある手順を選択する能力が必要です。DeepMindの理論が正しければ、これらの問題解決能力は将来の汎用AIモデルにとって非常に重要になります。

今年の夏、DeepMindはAlphaGeometry2と数学的推論AIモデルAlphaProofを組み合わせたシステムを発表しました。このシステムは、2024年IMOの6つの問題のうち4つを解きました。幾何学の問題だけでなく、この方法は複雑な工学計算など、他の数学や科学分野にも適用できます。

AlphaGeometry2の中核を成すのは、Google Geminiシリーズの言語モデルと「シンボルエンジン」です。Geminiモデルは、数学の規則を使ってシンボルエンジンが問題の解を導き出すのを支援します。IMOの幾何学の問題は、通常、点、線、円などの「構成要素」を追加する必要がある図形に基づいています。AlphaGeometry2のGeminiモデルは、問題解決に役立つ可能性のある構成要素を予測できます。

注目すべきは、AlphaGeometry2はIMOの問題を解く際に、DeepMind自身が生成した3億を超える定理と証明の合成データを使ってトレーニングされていることです。研究チームは過去25年間のIMOの45個の幾何学の問題を選び、拡張して最終的に50個の問題セットを作成しました。AlphaGeometry2は、そのうち42個を解き、金メダリストの平均点を上回りました。

しかし、AlphaGeometry2にはまだいくつかの限界があります。例えば、可変数の点、非線形方程式、不等式を含む問題は解けません。それにもかかわらず、この研究は、AIシステムが記号操作をベースにするべきか、ニューラルネットワークをベースにするべきかという議論を引き起こしています。AlphaGeometry2は、ニューラルネットワークとルールベースのシンボルエンジンの両方を組み合わせたハイブリッドアプローチを採用しています。

AlphaGeometry2の成功は、汎用AIの将来の発展に新たな方向性を示しています。現在はまだ完全に自立しているわけではありませんが、DeepMindチームの研究は、将来的にはより自立したAIモデルが登場する可能性を示唆しています。

論文へのリンク:https://arxiv.org/pdf/2502.03544

要点:

📊 AlphaGeometry2は過去25年間のIMOの問題の84%を解き、金メダリストの平均点を上回りました。

🔍 このシステムはニューラルネットワークとシンボルエンジンを組み合わせたハイブリッドアプローチで、複雑な数学の問題を解きます。

📈 DeepMindは幾何学の問題を解くことで、より強力な汎用AIの研究を進展させたいと考えています。