Megatron-LM
Recherche continue sur les modèles Transformer entraînés à grande échelle
Produit OrdinaireProductivitéTransformerModèle linguistique
Megatron-LM est un puissant modèle Transformer à grande échelle développé par l'équipe de recherche sur l'apprentissage profond appliqué de NVIDIA. Ce produit est utilisé pour la recherche continue sur l'entraînement à grande échelle des modèles linguistiques Transformer. Nous utilisons la précision mixte, le parallélisme de modèle et de données efficace, ainsi que le pré-entraînement de modèles Transformer multinœuds (tels que GPT, BERT et T5).
Megatron-LM Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34