Megatron-LM

Investigación continua sobre el entrenamiento a gran escala de modelos Transformer

Producto ComúnProductividadTransformerModelo de lenguaje
Megatron-LM es un potente modelo Transformer a gran escala desarrollado por el equipo de investigación de aprendizaje profundo de NVIDIA. Este producto se utiliza en la investigación continua sobre el entrenamiento a gran escala de modelos de lenguaje Transformer. Empleamos precisión mixta, paralelismo de modelo y de datos eficientes, y el preentrenamiento de modelos Transformer multinodo (como GPT, BERT y T5).
Abrir sitio web

Megatron-LM Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

Megatron-LM Tendencia de visitas

Megatron-LM Distribución geográfica de las visitas

Megatron-LM Fuentes de tráfico

Megatron-LM Alternativas