MobileLLM-600M

Modèle linguistique de 600M de paramètres, hautement optimisé et conçu pour les applications embarquées.

Produit OrdinaireProgrammationModèle linguistiqueTransformer
MobileLLM-600M est un modèle linguistique autorégressif développé par Meta, basé sur une architecture Transformer optimisée et conçu pour les applications embarquées aux ressources limitées. Ce modèle intègre des technologies clés telles que la fonction d'activation SwiGLU, une architecture profonde et fine, le partage d'embeddings et l'attention d'interrogation groupée. MobileLLM-600M a montré une amélioration significative des performances sur les tâches de raisonnement de bon sens à zéro-shot, avec une augmentation de précision de 2,7 % et 4,3 % respectivement par rapport aux modèles SoTA précédents de 125M/350M. Le concept de conception de ce modèle est extensible à des modèles plus importants, tels que MobileLLM-1B/1.5B, qui ont tous deux obtenu des résultats SoTA.
Ouvrir le site Web

MobileLLM-600M Dernière situation du trafic

Nombre total de visites mensuelles

29742941

Taux de rebond

44.20%

Nombre moyen de pages par visite

5.9

Durée moyenne de la visite

00:04:44

MobileLLM-600M Tendance des visites

MobileLLM-600M Distribution géographique des visites

MobileLLM-600M Sources de trafic

MobileLLM-600M Alternatives