Mistral AIチームがまたも大きなニュースを発表しました。最近、彼らはMathΣtralという数学モデルを発表しました。これはアルキメデスの生誕2311周年へのオマージュであると同時に、数学的推論と科学的発見における大きなブレークスルーです。

MathΣtralは、数学的推論と科学的発見のために設計された7Bパラメータのモデルで、32kのコンテキストウィンドウを備えています。これは、より長く複雑な数学の問題を処理できることを意味します。Apache2.0ライセンスの下でオープンソース化されており、学術界や開発者にとって大きなメリットとなります。

image.png

Mistral AIチームはMathΣtralを科学界に貢献し、複雑で多段階の論理的推論を必要とする高度な数学問題の研究を強化することを目指しています。STEM分野における専門的な能力は、様々な業界標準ベンチマークテストにおいて同クラス最高の推論能力を達成しています。特に、MATHベンチマークテストでは56.6%、MMLUベンチマークテストでは63.47%というスコアを記録しました。

MathΣtralの最も注目すべき点は、その推論能力です。このモデルは、より多くの推論時間をかけることで、明らかに優れた結果が得られることを証明しました。MATHベンチマークテストでは、多数決によりMathΣtral 7Bのスコアは68.37%に達し、64人の候補者の中から強力な報酬モデルを用いることで、スコアは74.59%にまで上昇しました。

image.png

Mistral AIチームのこの取り組みは、同社が学術プロジェクトを支援する広範な取り組みの一環です。MathΣtralの発表は、Project Numinaとの連携という背景のもとに行われ、Mistral AIが学術研究を重視し、支援していることを示しています。

MathΣtralは、Mistral AIのドキュメントに従って使用または微調整できるガイド付きモデルです。モデルの重みはHugging Faceでホストされており、現在、ユーザーはmisstral-inferenceを使用してMathΣtralを試用し、misstral-finetuneを使用して特定のニーズに合わせて調整できます。

Mistral AIのMathΣtralモデルは、技術的な飛躍であると同時に、数学と科学分野の研究への深い貢献でもあります。AI技術の進歩に伴い、MathΣtralが数学的推論と科学的発見により多くの可能性とブレークスルーをもたらすと確信しています。

公式サイト:https://mistral.ai/news/mathstral/