Megatron-LM

Pesquisa contínua em treinamento de modelos Transformer em larga escala

Produto ComumProdutividadeTransformerModelo de Linguagem
Megatron-LM é um poderoso modelo Transformer em larga escala desenvolvido pela equipe de pesquisa de aprendizado profundo da NVIDIA. Este produto é usado em pesquisas contínuas de treinamento de modelos de linguagem Transformer em larga escala. Utilizamos precisão mista, paralelismo de modelo e de dados eficiente, e pré-treinamento de modelos Transformer multinodo (como GPT, BERT e T5).
Abrir Site

Megatron-LM Situação do Tráfego Mais Recente

Total de Visitas Mensais

474564576

Taxa de Rejeição

36.20%

Média de Páginas por Visita

6.1

Duração Média da Visita

00:06:34

Megatron-LM Tendência de Visitas

Megatron-LM Distribuição Geográfica das Visitas

Megatron-LM Fontes de Tráfego

Megatron-LM Alternativas