Steiner-32b-preview

Steiner é um modelo de raciocínio treinado em dados sintéticos, projetado para explorar vários caminhos de raciocínio e verificar autonomamente.

Produto ComumProdutividadeModelo de raciocínioAprendizado por reforço
Steiner é uma série de modelos de raciocínio desenvolvida por Yichao 'Peak' Ji, que se concentra no treinamento em dados sintéticos por meio de aprendizado por reforço, podendo explorar vários caminhos e verificar ou retroceder autonomamente durante o raciocínio. O objetivo do modelo é reproduzir a capacidade de raciocínio do OpenAI o1 e verificar a curva de expansão durante o raciocínio. Steiner-preview é um projeto em andamento, e seu objetivo de código aberto é compartilhar conhecimento e obter feedback de mais usuários reais. Embora o modelo tenha apresentado um desempenho excelente em alguns testes de referência, ele ainda não alcançou totalmente a capacidade de expansão de raciocínio do OpenAI o1, portanto, ainda está em fase de desenvolvimento.
Abrir Site

Steiner-32b-preview Situação do Tráfego Mais Recente

Total de Visitas Mensais

29742941

Taxa de Rejeição

44.20%

Média de Páginas por Visita

5.9

Duração Média da Visita

00:04:44

Steiner-32b-preview Tendência de Visitas

Steiner-32b-preview Distribuição Geográfica das Visitas

Steiner-32b-preview Fontes de Tráfego

Steiner-32b-preview Alternativas