Light-R1-14B-DS

Ein quelloffenes mathematisches Modell mit 14 Milliarden Parametern, das durch Reinforcement Learning trainiert wurde und eine hervorragende Leistung aufweist.

Normales ProduktProduktivitätReinforcement LearningMathematisches Modell

Website öffnen

Light-R1-14B-DS ist ein quelloffenes mathematisches Modell, das von Beijing Qihu Technology Co., Ltd. entwickelt wurde. Das Modell basiert auf DeepSeek-R1-Distill-Qwen-14B und wurde durch Reinforcement Learning trainiert. Es erreichte bei den Benchmark-Tests der AIME24 und AIME25 Mathematik-Wettbewerbe hohe Punktzahlen von 74,0 bzw. 60,2 und übertraf damit viele Modelle mit 32 Milliarden Parametern. Es gelang, mit geringem Budget ein Reinforcement-Learning für bereits feinabgestimmte Modelle mit Long-Chain-Inferenz zu implementieren, wodurch der Open-Source-Community ein leistungsstarkes Werkzeug für mathematische Modelle zur Verfügung gestellt wird. Die Open-Source-Veröffentlichung des Modells trägt zur Förderung der Anwendung der Verarbeitung natürlicher Sprache im Bildungsbereich bei, insbesondere im Bereich der Lösung mathematischer Probleme, und bietet Forschern und Entwicklern eine wertvolle Grundlage für Forschung und Praxis.

Best AI Websites & Tools

Light-R1-14B-DS

Light-R1-14B-DS Neueste Verkehrssituation

Light-R1-14B-DS Besuchstrend

Light-R1-14B-DS Geografische Verteilung der Besuche

Light-R1-14B-DS Traffic-Quellen

Light-R1-14B-DS Alternativen

Light-R1-14B-DS — Ein quelloffenes mathematisches Modell mit 14 Milliarden Parametern, das durch Reinforcement Learning trainiert wurde und eine hervorragende Leistung aufweist.

Light-R1 — Light-R1 ist ein Open-Source-Projekt, das sich auf Long-Chain-Inferenz (Long COT) konzentriert und eine Trainingmethode von Grund auf bietet, die auf kursbasiertem SFT, DPO und RL basiert.

Steiner-32b-preview — Steiner ist ein auf synthetischen Daten trainiertes Inferenzmodell, das darauf ausgelegt ist, verschiedene Inferenzpfade zu erkunden und eigenständig zu verifizieren.

DeepSeek-R1-Distill-Qwen-1.5B — DeepSeek-R1-Distill-Qwen-1.5B ist ein hocheffizientes, Open-Source-Sprachmodell für diverse Aufgaben der Verarbeitung natürlicher Sprache.

DeepSeek-R1-Distill-Llama-8B — DeepSeek-R1-Distill-Llama-8B ist ein leistungsstarkes Open-Source-Sprachmodell für Textgenerierung und Inferenzaufgaben.

DeepSeek-R1-Distill-Qwen-32B — DeepSeek-R1-Distill-Qwen-32B ist ein leistungsstarkes Open-Source-Sprachmodell für diverse Textgenerierungsaufgaben.

DeepSeek-R1-Zero — DeepSeek-R1-Zero ist ein durch massives Reinforcement Learning trainiertes Inferenzmodell, das ohne überwachtes Feinabstimmen eine herausragende Inferenzleistung erzielt.

DeepSeek-R1 — DeepSeek-R1 ist ein Hochleistungs-Inferenzmodell, das mehrere Sprachen und Aufgaben unterstützt und sich für Forschungs- und kommerzielle Anwendungen eignet.

selbstadaptierende LLMs — Ein selbstadaptierendes Framework für Large Language Models (LLMs), das sich in Echtzeit an unbekannte Aufgaben anpasst.

Unitree RL GYM — Unitree Roboterplattform für Reinforcement Learning

agibot_x1_train — Modularer humanoiden Roboter für das Reinforcement Learning Training

Qwen2.5-Math — Führendes quelloffenes großes Sprachmodell für Mathematik

Same — Ein Tool, mit dem Sie jede Webseiten-Benutzeroberfläche kopieren und Code-Vorschläge generieren können.

Sesame CSM — Ein Modell zur Generierung von dialogischer Sprache, das die Generierung hochwertiger Sprache aus Text- und Audioeingaben unterstützt.

RagaAI — RagaAI Catalyst ist eine Plattform zum Beobachten, Bewerten und Debuggen von AI-Agenten, die Entwicklern hilft, AI-Workflows zu optimieren und sicher bereitzustellen.

open-mcp-client — Ein Open-Source-Client für Multi-Cloud-Plattformen, der LangGraph-Agent und Frontend-Anwendungsentwicklung unterstützt.

IMM — Inductive Moment Matching ist ein neuartiges generatives Modell für die Erzeugung hochwertiger Bilder.

BashBuddy — Mit BashBuddy können Sie Befehle auf natürliche Weise eingeben, ohne sich um Parameter oder Syntax kümmern zu müssen.

R1-Omni — R1-Omni ist ein multimodalen Emotionserkennungsmodell, das Reinforcement Learning integriert und sich auf die Verbesserung der Interpretierbarkeit der multimodalen Emotionserkennung konzentriert.

nanobrowser — Open-Source Chrome-Erweiterung für KI-gestützte Netzwerkautomatisierung, unterstützt Multi-Agent-Workflows.

l1m — Eine Proxy-API zur Extraktion strukturierter Daten aus Text und Bildern, basierend auf LLMs.

Proxy Lite — Proxy Lite ist ein Open-Source-visuell-linguistisches Modell (VLM) mit 3B Parametern, das sich auf Webautomatisierungsaufgaben konzentriert.

AoT — Atom of Thoughts (AoT) ist ein Framework zur Verbesserung der Inferenzleistung großer Sprachmodelle.

OpenManus — OpenManus ist ein Open-Source-Projekt für intelligente Agenten, das ohne Einladungscode verwendet werden kann.

CocoIndex — CocoIndex ist eine Open-Source-Datenindexierungs-Engine, die benutzerdefinierte Konvertierungslogik und inkrementelle Updates unterstützt.

NeoBase — NeoBase ist ein Open-Source-KI-Datenbankassistent, mit dem Sie über natürliche Sprache mit Datenbanken interagieren können.

Instella — Instella ist ein von AMD entwickeltes, leistungsstarkes Open-Source-Sprachmodell, das speziell für die Beschleunigung der Entwicklung von Open-Source-Sprachmodellen entwickelt wurde.

Aya Vision 32B — Aya Vision 32B ist ein mehrsprachiges visuell-sprachliches Modell, das für OCR, Bildbeschreibung, visuelles Schließen und andere Zwecke geeignet ist.

Aya Vision 8B — Modèle de langage visuel multilingue à 800 millions de paramètres, prenant en charge l'OCR, la description d'images et le raisonnement visuel.

Scira — Scira ist eine minimalistische, KI-gestützte Suchmaschine, die Nutzern hilft, Informationen im Internet zu finden.