El asistente inteligente Kimi de la cara oscura de la luna anuncia el lanzamiento de su nueva generación de modelos de razonamiento matemático, k0-math. El modelo k0-math ha demostrado un rendimiento excepcional en varias pruebas de referencia de habilidades matemáticas, superando a los modelos o1-mini y o1-preview de la serie o1 de OpenAI en cuatro pruebas de referencia matemáticas: exámenes de secundaria, exámenes de universidad, exámenes de ingreso a posgrado y MATH, que incluye problemas de concursos de nivel introductorio.
En particular, en la prueba MATH, el modelo k0-math obtuvo una puntuación de 93.8, solo superado por la versión completa de o1 con 94.8 puntos. Aunque en las pruebas de referencia de nivel competitivo OMNI-MATH y AIME, el modelo k0-math en su versión inicial alcanzó el 90% y el 83% del mejor resultado de o1-mini respectivamente, la compañía planea iteraciones continuas para mejorar su capacidad de resolución de problemas más complejos.
El modelo k0-math utiliza una nueva técnica de aprendizaje reforzado y razonamiento en cadena de pensamiento, simulando el proceso de pensamiento y reflexión del cerebro humano para mejorar significativamente su capacidad de resolver problemas matemáticos complejos.
El modelo dedica más tiempo a la deducción durante el proceso de resolución de problemas, incluyendo la reflexión y la planificación de estrategias, y se autocorrige si es necesario para mejorar la tasa de éxito.
Aunque el modelo k0-math muestra un excelente rendimiento en la resolución de la mayoría de los problemas matemáticos difíciles, la versión actual no puede resolver problemas de geometría que son difíciles de describir en formato LaTeX, y puede sobrepensar problemas demasiado simples. También tiene una cierta probabilidad de cometer errores en problemas de exámenes universitarios de alto nivel y problemas IMO.