MobileLLM-125M

デバイス向けアプリケーション用に設計された、効率的に最適化された小型言語モデル。

一般製品プログラミング言語モデルデバイス向けアプリケーション
MobileLLM-125MはMetaによって開発された、自己回帰言語モデルです。最適化されたTransformerアーキテクチャを利用しており、リソースの限られたデバイス向けアプリケーション用に設計されています。このモデルは、SwiGLU活性化関数、薄い深層アーキテクチャ、埋め込み共有、グループ化クエリアテンションなど、複数の重要な技術を統合しています。MobileLLM-125M/350Mは、ゼロショット常識推論タスクにおいて、前世代の125M/350M SoTAモデルと比較して、それぞれ2.7%と4.3%の精度向上を実現しました。このモデルの設計理念は、より大規模なモデルにも効果的に拡張でき、MobileLLM-600M/1B/1.5BもSoTAの結果を達成しています。
ウェブサイトを開く

MobileLLM-125M 最新のトラフィック状況

月間総訪問数

29742941

直帰率

44.20%

平均ページ/訪問

5.9

平均訪問時間

00:04:44

MobileLLM-125M 訪問数の傾向

MobileLLM-125M 訪問地理的分布

MobileLLM-125M トラフィックソース

MobileLLM-125M 代替品