Megatron-LM
Pesquisa contínua em treinamento de modelos Transformer em larga escala
Produto ComumProdutividadeTransformerModelo de Linguagem
Megatron-LM é um poderoso modelo Transformer em larga escala desenvolvido pela equipe de pesquisa de aprendizado profundo da NVIDIA. Este produto é usado em pesquisas contínuas de treinamento de modelos de linguagem Transformer em larga escala. Utilizamos precisão mista, paralelismo de modelo e de dados eficiente, e pré-treinamento de modelos Transformer multinodo (como GPT, BERT e T5).
Megatron-LM Situação do Tráfego Mais Recente
Total de Visitas Mensais
474564576
Taxa de Rejeição
36.20%
Média de Páginas por Visita
6.1
Duração Média da Visita
00:06:34