DeepScaleR-1.5B-Preview

強化学習によって最適化された大規模言語モデルで、数学問題解決能力の向上に特化しています。

一般製品生産性人工知能強化学習
DeepScaleR-1.5B-Previewは、強化学習によって最適化された大規模言語モデルであり、数学問題解決能力の向上に特化しています。このモデルは分散型強化学習アルゴリズムを用いることで、長文推論における精度を大幅に向上させています。主な利点としては、効率的なトレーニング戦略、顕著な性能向上、そしてオープンソースによる柔軟性などが挙げられます。このモデルはカリフォルニア大学バークレー校のSky Computing LabとBerkeley AI Researchチームによって開発され、特に数学教育や競技数学の分野における人工知能の応用を推進することを目的としています。MITオープンソースライセンスを採用しており、研究者や開発者は無料で利用できます。
ウェブサイトを開く

DeepScaleR-1.5B-Preview 最新のトラフィック状況

月間総訪問数

29742941

直帰率

44.20%

平均ページ/訪問

5.9

平均訪問時間

00:04:44

DeepScaleR-1.5B-Preview 訪問数の傾向

DeepScaleR-1.5B-Preview 訪問地理的分布

DeepScaleR-1.5B-Preview トラフィックソース

DeepScaleR-1.5B-Preview 代替品