DeepSeek-R1 ist das erste Inferenzmodell des DeepSeek-Teams. Es wurde durch groß angelegtes Reinforcement Learning trainiert und zeigt ohne überwachte Feinabstimmung eine hervorragende Inferenzleistung. Das Modell erzielt exzellente Ergebnisse bei mathematischen, Code- und Inferenzaufgaben und ist vergleichbar mit dem OpenAI-o1 Modell. DeepSeek-R1 bietet zudem mehrere destillierte Modelle für Szenarien mit unterschiedlichen Größen- und Leistungsanforderungen. Seine Open-Source-Natur stellt der Forschungsgemeinschaft ein leistungsstarkes Werkzeug zur Verfügung und erlaubt die kommerzielle Nutzung und Weiterentwicklung.