Megatron-LM

Recherche continue sur les modèles Transformer entraînés à grande échelle

Produit OrdinaireProductivitéTransformerModèle linguistique
Megatron-LM est un puissant modèle Transformer à grande échelle développé par l'équipe de recherche sur l'apprentissage profond appliqué de NVIDIA. Ce produit est utilisé pour la recherche continue sur l'entraînement à grande échelle des modèles linguistiques Transformer. Nous utilisons la précision mixte, le parallélisme de modèle et de données efficace, ainsi que le pré-entraînement de modèles Transformer multinœuds (tels que GPT, BERT et T5).
Ouvrir le site Web

Megatron-LM Dernière situation du trafic

Nombre total de visites mensuelles

474564576

Taux de rebond

36.20%

Nombre moyen de pages par visite

6.1

Durée moyenne de la visite

00:06:34

Megatron-LM Tendance des visites

Megatron-LM Distribution géographique des visites

Megatron-LM Sources de trafic

Megatron-LM Alternatives