Moonlight
Moonlight est un modèle d'expert mixte de 16 milliards de paramètres, entraîné avec l'optimiseur Muon, et offrant des performances exceptionnelles.
Produit OrdinaireProductivitéTraitement du langage naturelOptimisation de modèle
Moonlight est un modèle d'expert mixte (MoE) de 16 milliards de paramètres, entraîné à l'aide de l'optimiseur Muon, démontrant d'excellentes performances lors d'entraînements à grande échelle. L'ajout d'une régularisation par poids et l'ajustement du taux de mise à jour des paramètres ont significativement amélioré l'efficacité et la stabilité de l'entraînement. Ce modèle surpasse les modèles existants sur plusieurs tests de référence, tout en réduisant considérablement la puissance de calcul nécessaire à son entraînement. L'implémentation open source de Moonlight et son modèle pré-entraîné offrent aux chercheurs et développeurs un outil puissant pour diverses tâches de traitement du langage naturel, telles que la génération de texte et la génération de code.
Moonlight Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34