MAmmoTH:数学問題特化の大規模言語モデル

ウォータールー大学などの機関が共同で、数学問題に特化した大規模言語モデルMAmmoTHをオープンソースとして公開しました。MAmmoTHは、数学推論データセットにおいて既存のオープンソースモデルを上回り、平均正解率を12~29%向上させています。

特に、MAmmoTH-7Bモデルは、競技レベルのデータセットにおいて35%の正解率を達成し、最高のオープンソース7Bモデルを凌駕しました。また、MAmmoTH-34BモデルはMATHデータセットで46%の正解率を達成し、GPT-4の結果をも上回っています。

MAmmoTHの優れた性能により、数学推論分野における新たなトップランナーとなりました。