Steiner ist eine von Yichao 'Peak' Ji entwickelte Reihe von Inferenzmodellen, die sich darauf konzentriert, durch Reinforcement Learning auf synthetischen Daten zu trainieren und während der Inferenz mehrere Pfade zu erkunden und eigenständig zu verifizieren oder zurückzuverfolgen. Ziel des Modells ist es, die Inferenzfähigkeit von OpenAI o1 zu reproduzieren und die Skalierungskurve während der Inferenz zu verifizieren. Steiner-preview ist ein laufendes Projekt. Der Open-Source-Charakter dient dem Wissensaustausch und dem Einholen von Feedback von echten Nutzern. Obwohl das Modell in einigen Benchmark-Tests hervorragende Leistungen erbringt, ist die Inferenzskalierung von OpenAI o1 noch nicht vollständig erreicht, daher befindet es sich noch in der Entwicklung.