Megatron-LM
Investigación continua sobre el entrenamiento a gran escala de modelos Transformer
Producto ComúnProductividadTransformerModelo de lenguaje
Megatron-LM es un potente modelo Transformer a gran escala desarrollado por el equipo de investigación de aprendizaje profundo de NVIDIA. Este producto se utiliza en la investigación continua sobre el entrenamiento a gran escala de modelos de lenguaje Transformer. Empleamos precisión mixta, paralelismo de modelo y de datos eficientes, y el preentrenamiento de modelos Transformer multinodo (como GPT, BERT y T5).
Megatron-LM Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34