s1 ist ein Inferenzmodell, das sich auf die effiziente Textgenerierung mit wenigen Beispielen konzentriert. Es wird zur Laufzeit mithilfe von Budget-Forcing-Techniken erweitert und kann die Leistung von o1-preview erreichen. Das Modell wurde von Niklas Muennighoff et al. entwickelt, und die zugehörige Forschungsarbeit wurde auf arXiv veröffentlicht. Das Modell verwendet die Safetensors-Technologie, verfügt über 32,8 Milliarden Parameter und unterstützt Textgenerierungsaufgaben. Sein Hauptvorteil liegt in der Fähigkeit, mit wenigen Beispielen qualitativ hochwertige Inferenzen zu erzielen, was es ideal für Szenarien macht, in denen eine effiziente Textgenerierung erforderlich ist.