Moonlight
Moonlightは、Muon最適化器を用いて訓練された160億パラメータの混合専門家モデルで、優れた性能を誇ります。
一般製品生産性自然言語処理モデル最適化
Moonlightは、Muon最適化器で訓練された160億パラメータの混合専門家モデル(MoE)であり、大規模訓練において優れた成果を示しています。重み減衰の追加とパラメータ更新率の調整により、訓練効率と安定性が大幅に向上しました。複数のベンチマークテストにおいて既存モデルを上回り、同時に訓練に必要な計算量を大幅に削減しています。Moonlightのオープンソース実装と事前学習済みモデルは、研究者や開発者に強力なツールを提供し、テキスト生成、コード生成など、様々な自然言語処理タスクをサポートします。
Moonlight 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34