DCLM

大規模言語モデルの構築と訓練のための包括的なフレームワーク

プレミアム新製品プログラミング大規模言語モデルデータセット構築
DataComp-LM (DCLM) は、大規模言語モデル(LLM)の構築と訓練を目的とした包括的なフレームワークです。標準化されたコーパス、open_lmフレームワークに基づく効率的な事前学習レシピ、50種類以上の評価方法を提供します。DCLMは、4億1100万パラメータから70億パラメータのモデルまで、様々な計算規模で異なるデータセット構築戦略の実験を研究者が行えるようサポートします。DCLMは、最適化されたデータセット設計によりモデル性能を大幅に向上させ、様々な規模で優れた性能を示し、公開されているすべてのデータセットを凌駕する複数の高品質なデータセットの作成に貢献してきました。
ウェブサイトを開く

DCLM 最新のトラフィック状況

月間総訪問数

474564576

直帰率

36.20%

平均ページ/訪問

6.1

平均訪問時間

00:06:34

DCLM 訪問数の傾向

DCLM 訪問地理的分布

DCLM トラフィックソース

DCLM 代替品