Der KI-Assistent Kimi von Mondfinsternis kündigt die Einführung seines neuen mathematischen Inferenzmodells k0-math an. k0-math erzielte in mehreren Benchmark-Tests herausragende Ergebnisse und übertraf die Modelle o1-mini und o1-preview der OpenAI o1-Serie in vier mathematischen Benchmark-Tests: Mittlere Schulprüfung, Hochschulaufnahmeprüfung, Aufnahmeprüfung für weiterführende Studien und MATH (einschließlich Einsteiger-Wettbewerbsaufgaben).
Insbesondere beim MATH-Test erreichte k0-math einen Score von 93,8 Punkten und lag damit knapp hinter der Vollversion von o1 mit 94,8 Punkten. Obwohl das k0-math-Modell in der ersten Version bei den wettbewerbsorientierten Benchmark-Tests OMNI-MATH und AIME 90 % bzw. 83 % der Höchstleistung von o1-mini erreichte, plant das Unternehmen kontinuierliche Iterationen, um die Fähigkeiten zur Lösung komplexerer Probleme zu verbessern.
Das k0-math-Modell verwendet eine neue Technik des verstärkenden Lernens und des Chain-of-Thought-Reasoning. Durch die Simulation des Denk- und Reflexionsprozesses des menschlichen Gehirns wird die Fähigkeit zur Lösung komplexer mathematischer Probleme deutlich verbessert.
Das Modell benötigt mehr Zeit für das Lösen von Aufgaben, da es über den Lösungsweg nachdenkt und plant und bei Bedarf den Lösungsansatz selbstständig überdenkt und verbessert, um die Erfolgsrate zu erhöhen.
Obwohl das k0-math-Modell bei der Lösung der meisten anspruchsvollen mathematischen Probleme hervorragende Leistungen zeigt, kann die aktuelle Version noch keine geometrischen Probleme lösen, die sich nur schwer im LaTeX-Format darstellen lassen. Bei zu einfachen mathematischen Problemen neigt es möglicherweise zu Überdenken, und bei schwierigen Aufgaben der Hochschulaufnahmeprüfung und IMO-Aufgaben besteht eine gewisse Fehlerwahrscheinlichkeit.