Skywork-MoE-Base

1460億パラメーターの高性能混合エキスパートモデル

一般製品プログラミング混合エキスパートモデル大規模パラメーター
Skywork-MoE-Baseは、1460億パラメーターを持つ高性能混合エキスパート(MoE)モデルです。16個のエキスパートで構成され、220億パラメーターが活性化されます。このモデルは、Skywork-13Bモデルの密集型チェックポイントから初期化され、2つの革新的な技術を導入しています。1つは、ゲート制御ロジックによる正規化でエキスパートの多様性を強化する技術、もう1つは、層ごとに補助損失係数を調整できる適応型補助損失係数です。Skywork-MoEは、様々な一般的なベンチマークテストにおいて、パラメーター数または活性化パラメーター数の多いモデルと同等か、それ以上の性能を示しています。
ウェブサイトを開く

Skywork-MoE-Base 最新のトラフィック状況

月間総訪問数

29742941

直帰率

44.20%

平均ページ/訪問

5.9

平均訪問時間

00:04:44

Skywork-MoE-Base 訪問数の傾向

Skywork-MoE-Base 訪問地理的分布

Skywork-MoE-Base トラフィックソース

Skywork-MoE-Base 代替品