s1-32B

s1は、Qwen2.5-32B-Instructを微調整した推論モデルであり、わずか1000サンプルでトレーニングされています。

一般製品生産性テキスト生成推論モデル
s1は、少量のサンプルで効率的なテキスト生成能力を実現することに重点を置いた推論モデルです。予算強制技術を用いてテスト時に拡張することで、o1-previewと同等の性能を達成します。このモデルはNiklas Muennighoff氏らによって開発され、関連研究はarXivに掲載されています。Safetensors技術を採用しており、328億パラメータを備え、テキスト生成タスクに対応します。主な利点は、少量のサンプルで高品質な推論を実現できることであり、効率的なテキスト生成が必要なシナリオに適しています。
ウェブサイトを開く

s1-32B 最新のトラフィック状況

月間総訪問数

29742941

直帰率

44.20%

平均ページ/訪問

5.9

平均訪問時間

00:04:44

s1-32B 訪問数の傾向

s1-32B 訪問地理的分布

s1-32B トラフィックソース

s1-32B 代替品