Steiner-32b-preview

Steinerは、合成データでトレーニングされた推論モデルであり、複数の推論経路を探索し、自律的に検証することを目的としています。

一般製品生産性推論モデル強化学習
Steinerは、Yichao 'Peak' Jiによって開発された推論モデルシリーズであり、強化学習による合成データ上でのトレーニングに焦点を当てており、推論時に複数の経路を探索し、自律的に検証または遡ることができます。このモデルの目標は、OpenAI o1の推論能力を再現し、推論時の拡張曲線を検証することです。Steiner-previewは進行中のプロジェクトであり、オープンソースとする目的は知識を共有し、より多くのリアルユーザーからのフィードバックを得ることです。このモデルはいくつかのベンチマークテストで優れたパフォーマンスを示していますが、OpenAI o1の推論拡張能力を完全に実現しているわけではなく、開発段階にあります。
ウェブサイトを開く

Steiner-32b-preview 最新のトラフィック状況

月間総訪問数

29742941

直帰率

44.20%

平均ページ/訪問

5.9

平均訪問時間

00:04:44

Steiner-32b-preview 訪問数の傾向

Steiner-32b-preview 訪問地理的分布

Steiner-32b-preview トラフィックソース

Steiner-32b-preview 代替品