ChatGLM-Math é um modelo de resolução de problemas matemáticos personalizado com base em um processo de autocrítica, projetado para melhorar a capacidade de modelos de linguagem grandes (LLMs) na resolução de problemas matemáticos. O modelo treina um modelo Math-Critique genérico para fornecer sinais de feedback e emprega ajuste fino de amostragem de rejeição e otimização de preferência direta para aprimorar a capacidade de resolução de problemas matemáticos do LLM. Foi testado em conjuntos de dados acadêmicos e no novo conjunto de dados desafiador MathUserEval, mostrando uma melhoria significativa na resolução de problemas matemáticos, mantendo ao mesmo tempo a capacidade de linguagem.