MobileLLM-600M
Modèle linguistique de 600M de paramètres, hautement optimisé et conçu pour les applications embarquées.
Produit OrdinaireProgrammationModèle linguistiqueTransformer
MobileLLM-600M est un modèle linguistique autorégressif développé par Meta, basé sur une architecture Transformer optimisée et conçu pour les applications embarquées aux ressources limitées. Ce modèle intègre des technologies clés telles que la fonction d'activation SwiGLU, une architecture profonde et fine, le partage d'embeddings et l'attention d'interrogation groupée. MobileLLM-600M a montré une amélioration significative des performances sur les tâches de raisonnement de bon sens à zéro-shot, avec une augmentation de précision de 2,7 % et 4,3 % respectivement par rapport aux modèles SoTA précédents de 125M/350M. Le concept de conception de ce modèle est extensible à des modèles plus importants, tels que MobileLLM-1B/1.5B, qui ont tous deux obtenu des résultats SoTA.
MobileLLM-600M Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44