Light-R1-14B-DS

Ein quelloffenes mathematisches Modell mit 14 Milliarden Parametern, das durch Reinforcement Learning trainiert wurde und eine hervorragende Leistung aufweist.

Normales ProduktProduktivitätReinforcement LearningMathematisches Modell
Light-R1-14B-DS ist ein quelloffenes mathematisches Modell, das von Beijing Qihu Technology Co., Ltd. entwickelt wurde. Das Modell basiert auf DeepSeek-R1-Distill-Qwen-14B und wurde durch Reinforcement Learning trainiert. Es erreichte bei den Benchmark-Tests der AIME24 und AIME25 Mathematik-Wettbewerbe hohe Punktzahlen von 74,0 bzw. 60,2 und übertraf damit viele Modelle mit 32 Milliarden Parametern. Es gelang, mit geringem Budget ein Reinforcement-Learning für bereits feinabgestimmte Modelle mit Long-Chain-Inferenz zu implementieren, wodurch der Open-Source-Community ein leistungsstarkes Werkzeug für mathematische Modelle zur Verfügung gestellt wird. Die Open-Source-Veröffentlichung des Modells trägt zur Förderung der Anwendung der Verarbeitung natürlicher Sprache im Bildungsbereich bei, insbesondere im Bereich der Lösung mathematischer Probleme, und bietet Forschern und Entwicklern eine wertvolle Grundlage für Forschung und Praxis.
Website öffnen

Light-R1-14B-DS Neueste Verkehrssituation

Monatliche Gesamtbesuche

29742941

Absprungrate

44.20%

Durchschnittliche Seiten pro Besuch

5.9

Durchschnittliche Besuchsdauer

00:04:44

Light-R1-14B-DS Besuchstrend

Light-R1-14B-DS Geografische Verteilung der Besuche

Light-R1-14B-DS Traffic-Quellen

Light-R1-14B-DS Alternativen