Steiner é uma série de modelos de raciocínio desenvolvida por Yichao 'Peak' Ji, que se concentra no treinamento em dados sintéticos por meio de aprendizado por reforço, podendo explorar vários caminhos e verificar ou retroceder autonomamente durante o raciocínio. O objetivo do modelo é reproduzir a capacidade de raciocínio do OpenAI o1 e verificar a curva de expansão durante o raciocínio. Steiner-preview é um projeto em andamento, e seu objetivo de código aberto é compartilhar conhecimento e obter feedback de mais usuários reais. Embora o modelo tenha apresentado um desempenho excelente em alguns testes de referência, ele ainda não alcançou totalmente a capacidade de expansão de raciocínio do OpenAI o1, portanto, ainda está em fase de desenvolvimento.