Steiner-32b-preview

Steiner ist ein auf synthetischen Daten trainiertes Inferenzmodell, das darauf ausgelegt ist, verschiedene Inferenzpfade zu erkunden und eigenständig zu verifizieren.

Normales ProduktProduktivitätInferenzmodellReinforcement Learning
Steiner ist eine von Yichao 'Peak' Ji entwickelte Reihe von Inferenzmodellen, die sich darauf konzentriert, durch Reinforcement Learning auf synthetischen Daten zu trainieren und während der Inferenz mehrere Pfade zu erkunden und eigenständig zu verifizieren oder zurückzuverfolgen. Ziel des Modells ist es, die Inferenzfähigkeit von OpenAI o1 zu reproduzieren und die Skalierungskurve während der Inferenz zu verifizieren. Steiner-preview ist ein laufendes Projekt. Der Open-Source-Charakter dient dem Wissensaustausch und dem Einholen von Feedback von echten Nutzern. Obwohl das Modell in einigen Benchmark-Tests hervorragende Leistungen erbringt, ist die Inferenzskalierung von OpenAI o1 noch nicht vollständig erreicht, daher befindet es sich noch in der Entwicklung.
Website öffnen

Steiner-32b-preview Neueste Verkehrssituation

Monatliche Gesamtbesuche

29742941

Absprungrate

44.20%

Durchschnittliche Seiten pro Besuch

5.9

Durchschnittliche Besuchsdauer

00:04:44

Steiner-32b-preview Besuchstrend

Steiner-32b-preview Geografische Verteilung der Besuche

Steiner-32b-preview Traffic-Quellen

Steiner-32b-preview Alternativen