月之暗面Kimiインテリジェントアシスタントは、新世代数学推論モデルk0-mathを発表しました。k0-mathモデルは、複数の数学基準能力テストで優れた成績を収め、中考、高考、考研、そして入門レベルの競技問題を含むMATHの4つの数学基準テストにおいて、OpenAI o1シリーズのo1-miniとo1-previewモデルを上回りました。

微信截图_20241118075443.png

特にMATHテストでは、k0-mathモデルは93.8点を獲得し、o1完全版の94.8点に次ぐ結果となりました。競技レベルのOMNI-MATHとAIME基準テストでは、k0-math初代モデルの成績はそれぞれo1-miniの最高成績の90%と83%に達しましたが、より難しい問題への対応能力向上のため、継続的な改良を予定しています。

k0-mathモデルは、全く新しい強化学習と思考連鎖推論技術を採用しており、人間の思考と反省のプロセスを模倣することで、数学の問題解決能力を大幅に向上させています。

このモデルは、問題解決において、思考と計画立案に多くの時間を費やし、必要に応じて自ら解法を見直し改善することで、正解率を高めています。

k0-mathモデルは、難易度の高い数学問題の大部分をうまく解くことができますが、現在のバージョンではLaTeX形式で記述が難しい幾何学図形の問題には対応できず、また、あまりにも簡単な問題に対しては過剰に思考する可能性があり、高考の問題やIMOの問題についても、間違える可能性が一定割合存在します。