Das k1-Serien-Verstärkungslernmodell ist da! Kimi, die dunkle Seite des Mondes, präsentiert ein visuelles Denkmodell

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 4 Minuten Lesezeit · Dec 16, 2024

382

Moon's Dark Side gibt heute die Veröffentlichung seines neuen visuellen Denkmodells k1 bekannt. Dieses Modell basiert auf Reinforcement Learning und unterstützt nicht nur ein End-to-End-Bildverständnis, sondern integriert auch die Technik der Denkverkettung (Thought Chain). Dadurch erweitert es seine Fähigkeiten über die Mathematik hinaus auf weitere grundlegende wissenschaftliche Bereiche wie Physik und Chemie. In Benchmark-Tests übertraf das k1-Modell weltweit führende Modelle wie OpenAIs o1, GPT-4o und Claude3.5Sonnet.

Das neue Modell erzeugt durch Anreize detailliertere Inferenzschritte und bildet so hochwertige Denkverkettungen, wodurch die Erfolgsrate bei der Lösung komplexer Aufgaben deutlich gesteigert wird. Die Kombination aus Bildverständnis und Denkfähigkeit von Kimis k1-Modell bietet Benutzern ein flüssigeres interaktives Erlebnis. Es kann eingegebene Bildinformationen direkt verarbeiten und Antworten liefern, ohne dass ein externes OCR oder ein zusätzliches visuelles Modell benötigt wird.

微信截图_20241216100218.png

Das Training des k1-Modells erfolgte in zwei Phasen: Zuerst wurde ein Basismodell vortrainiert, auf dessen Grundlage dann ein Reinforcement Learning-Feintuning durchgeführt wurde. Das Basismodell erzielte auf OCRBench hervorragende 903 Punkte und zeigte auch in den Benchmark-Testsätzen MathVista-testmini, MMMU-val und DocVQA herausragende Leistungen. Das Reinforcement Learning-Feintuning wurde hinsichtlich Datenqualität und Lerneffizienz optimiert und ermöglichte einen neuen Durchbruch im Hinblick auf Skalierbarkeit.

Kimi hat außerdem einen standardisierten Testsatz namens Science Vista erstellt, der mathematische und naturwissenschaftliche Bildaufgaben unterschiedlicher Schwierigkeitsgrade umfasst und der der gesamten Branche zur Verfügung gestellt wird. Obwohl das k1-Modell in internen Tests einige Einschränkungen aufwies, wie z. B. Verbesserungspotenzial bei der Generalisierung außerhalb der Verteilung und der Erfolgsrate bei komplexen Problemen, übertraf es andere Modelle in Szenarien mit visuellem Rauschen und zeigte eine überragende visuelle Erkennungsfähigkeit.

Das visuelle Denkmodell k1 des Kimi intelligenten Assistenten zeichnet sich nicht nur durch seine hervorragende Leistung im Bereich Mathematik aus, sondern erstreckt sich auch auf die Physik und Chemie und zeigt damit umfassende Fähigkeiten in den Grundlagenwissenschaften. Darüber hinaus zeigt das k1-Modell allgemeine Fähigkeiten, indem es nicht-mathematische Probleme wie den Inhalt und den Hintergrund von wissenschaftlichen Manuskripten erklären und ableiten kann.

Der Kimi intelligente Assistent freut sich darauf, mit den Nutzern die Welt zu erkunden. Das neue k1-Modell ist bereits online. Nutzer können die neue Funktion über die neueste Version der Kimi intelligenten Assistenten-App oder die Webversion erleben.

Entschlüsselung der dunklen Seite des Mondes o1: Long-CoT ist der Schlüssel, Modelldenken erfordert "langfristiges Denken"

Flood Sung, Forscher an der dunklen Seite des Mondes, veröffentlichte kürzlich einen ausführlichen Artikel mit über 10.000 Wörtern, in dem er erstmals die Forschungsansätze des k1.5-Modells detailliert darlegte und eine tiefgreifende Reflexion über die technischen Erkenntnisse des OpenAI o1-Modells anstellte. Laut Flood Sung wurde die Bedeutung von Long-CoT (Long-Chain-of-Thought, langkettiges Denken) bereits vor über einem Jahr von Tim Zhou Xinyu, Mitbegründer der dunklen Seite des Mondes, bestätigt. Durch das Training kleiner Modelle für mehrstellige Berechnungen und die Umwandlung detaillierter Berechnungsprozesse in Langketten-Denkdaten für SFT (Supervised Fine-Tuning, überwachtes Feintuning)...

Mondfinsternis veröffentlicht neue SOTA-Modell k1.5: Multimodale Inferenzfähigkeit verbessert

Das Unternehmen Mondfinsternis präsentiert stolz sein brandneues SOTA-Modell (State-of-the-Art) – das k1.5 Multimodale Denkmodell. Dies stellt einen bedeutenden Durchbruch im Bereich der multimodalen und allgemeinen Inferenz dar. Das Modell verfügt nicht nur über herausragende multimodale Verarbeitungsfähigkeiten, sondern zeigt auch außergewöhnliche Fähigkeiten im Bereich der allgemeinen Inferenz und bewältigt effektiv komplexe Aufgaben. Das größte Highlight des k1.5-Modells ist seine multimodale Inferenzfähigkeit. Es kann gleichzeitig Informationen aus verschiedenen Modalitäten wie Text, Bildern und Audio verarbeiten und so umfassendere und genauere Ergebnisse liefern.

Kimi veröffentlicht neues SOTA-Modell: das multimodale Denkmodell k1.5 ist da

Kürzlich gab die in Peking ansässige Firma Moonlit Dark Side Technology Co., Ltd. bekannt, dass ihr intelligenter Assistent Kimi ein bedeutendes technisches Upgrade erhalten hat und das neue multimodale Denkmodell k1.5 vorgestellt wurde. Dieses Modell erreicht branchenführende Leistung in multimodalem und allgemeinem Schlussfolgern und markiert einen weiteren bahnbrechenden Fortschritt von Kimi im Bereich der künstlichen Intelligenz.

KI-Nachrichten und -Informationen

Das k1-Serien-Verstärkungslernmodell ist da! Kimi, die dunkle Seite des Mondes, präsentiert ein visuelles Denkmodell

AIbase基地

Empfohlene verwandte KI-Nachrichten

Kimi k1.6-Modell enthüllt: Programmierfähigkeiten übertreffen GPT-3 und läuten eine neue Ära der KI ein

Entschlüsselung der dunklen Seite des Mondes o1: Long-CoT ist der Schlüssel, Modelldenken erfordert "langfristiges Denken"

Mondfinsternis veröffentlicht neue SOTA-Modell k1.5: Multimodale Inferenzfähigkeit verbessert

Kimi veröffentlicht neues SOTA-Modell: das multimodale Denkmodell k1.5 ist da