Steiner-32b-preview
Steiner é um modelo de raciocínio treinado em dados sintéticos, projetado para explorar vários caminhos de raciocínio e verificar autonomamente.
Produto ComumProdutividadeModelo de raciocínioAprendizado por reforço
Steiner é uma série de modelos de raciocínio desenvolvida por Yichao 'Peak' Ji, que se concentra no treinamento em dados sintéticos por meio de aprendizado por reforço, podendo explorar vários caminhos e verificar ou retroceder autonomamente durante o raciocínio. O objetivo do modelo é reproduzir a capacidade de raciocínio do OpenAI o1 e verificar a curva de expansão durante o raciocínio. Steiner-preview é um projeto em andamento, e seu objetivo de código aberto é compartilhar conhecimento e obter feedback de mais usuários reais. Embora o modelo tenha apresentado um desempenho excelente em alguns testes de referência, ele ainda não alcançou totalmente a capacidade de expansão de raciocínio do OpenAI o1, portanto, ainda está em fase de desenvolvimento.
Steiner-32b-preview Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44