L'assistant intelligent Kimi de la face cachée de la Lune annonce le lancement de son nouveau modèle de raisonnement mathématique, k0-math. Le modèle k0-math a démontré des performances exceptionnelles lors de plusieurs tests de référence en mathématiques, surpassant les modèles o1-mini et o1-preview de la série o1 d'OpenAI dans quatre tests de référence : examens de fin de collège, examens de fin de lycée, examens d'entrée à l'université et MATH (incluant des problèmes de concours de niveau débutant).

微信截图_20241118075443.png

Notamment, lors du test MATH, le modèle k0-math a obtenu un score de 93,8, juste derrière le score de 94,8 de la version complète d'o1. Bien que lors des tests de référence de niveau compétition OMNI-MATH et AIME, le modèle k0-math initial ait atteint respectivement 90 % et 83 % du score maximum d'o1-mini, la société prévoit des itérations continues pour améliorer sa capacité à résoudre des problèmes plus complexes.

Le modèle k0-math utilise une nouvelle technique d'apprentissage par renforcement et de raisonnement par chaîne de pensée. En simulant le processus de réflexion et de remise en question du cerveau humain, il améliore considérablement sa capacité à résoudre des problèmes mathématiques difficiles.

Lors de la résolution de problèmes, le modèle k0-math consacre plus de temps à la réflexion, y compris à la planification de sa stratégie, et se remet en question et améliore sa méthode si nécessaire, afin d'augmenter son taux de réussite.

Bien que le modèle k0-math excelle dans la résolution de la plupart des problèmes mathématiques difficiles, la version actuelle ne peut pas résoudre les problèmes de géométrie difficiles à décrire au format LaTeX. De plus, il peut sur-analyser les problèmes trop simples et a une certaine probabilité d'erreur sur les problèmes difficiles du baccalauréat et les problèmes de l'IMO (Olympiades internationales de mathématiques).