s1-32B
s1是一个基于Qwen2.5-32B-Instruct微调的推理模型,仅用1000个样本进行训练。
普通产品生产力文本生成推理模型
s1是一个推理模型,专注于通过少量样本实现高效的文本生成能力。它通过预算强制技术在测试时进行扩展,能够匹配o1-preview的性能。该模型由Niklas Muennighoff等人开发,相关研究发表在arXiv上。模型使用Safetensors技术,具有328亿参数,支持文本生成任务。其主要优点是能够通过少量样本实现高质量的推理,适合需要高效文本生成的场景。
s1-32B 最新流量情况
月总访问量
29742941
跳出率
44.20%
平均页面访问数
5.9
平均访问时长
00:04:44