Steiner-32b-preview
Steiner 是一个基于合成数据训练的推理模型,旨在探索多种推理路径并自主验证。
普通产品生产力推理模型强化学习
Steiner 是由 Yichao 'Peak' Ji 开发的推理模型系列,专注于通过强化学习在合成数据上训练,能够在推理时探索多种路径并自主验证或回溯。该模型的目标是复现 OpenAI o1 的推理能力,并验证推理时的扩展曲线。Steiner-preview 是一个正在进行中的项目,其开源目的是为了分享知识并获取更多真实用户的反馈。尽管该模型在某些基准测试中表现出色,但尚未完全实现 OpenAI o1 的推理扩展能力,因此仍处于开发阶段。
Steiner-32b-preview 最新流量情况
月总访问量
27175375
跳出率
44.30%
平均页面访问数
5.8
平均访问时长
00:04:57