Megatron-LM
Kontinuierliche Forschung zur Entwicklung und zum Training großer Transformer-Modelle
Normales ProduktProduktivitätTransformerSprachmodell
Megatron-LM ist ein leistungsstarkes, großes Transformer-Modell, entwickelt vom NVIDIA-Team für angewandte Deep-Learning-Forschung. Das Produkt dient der fortlaufenden Forschung zum Training großer Transformer-Sprachmodelle. Wir verwenden dabei gemischte Genauigkeit (Mixed Precision), effiziente Modell- und Datenparallelität sowie das Vortraining von Multi-Node-Transformer-Modellen wie GPT, BERT und T5.
Megatron-LM Neueste Verkehrssituation
Monatliche Gesamtbesuche
474564576
Absprungrate
36.20%
Durchschnittliche Seiten pro Besuch
6.1
Durchschnittliche Besuchsdauer
00:06:34