ChatGLM-Mathは、自己批判プロセスに基づいてカスタマイズされた数学問題解決モデルであり、大規模言語モデル(LLM)の数学問題解決能力の向上を目指しています。本モデルは、汎用的なMath-Critiqueモデルをトレーニングすることでフィードバック信号を提供し、拒否サンプリング微調整と直接選好最適化を用いてLLMの数学問題解決能力を強化します。学術データセットと新たに作成された挑戦的なデータセットMathUserEvalで実験を行い、言語能力を維持しながら、数学問題解決能力が大幅に向上することを示しました。