Megatron-LM

大规模训练 Transformer 模型的持续研究

普通产品生产力Transformer语言模型
Megatron-LM 是由 NVIDIA 应用深度学习研究团队开发的一种强大的大规模 Transformer 模型。该产品用于大规模训练 Transformer 语言模型的持续研究。我们使用混合精度,高效的模型并行和数据并行,以及多节点的 Transformer 模型(如 GPT、BERT 和 T5)的预训练。
打开网站

Megatron-LM 最新流量情况

月总访问量

488643166

跳出率

37.28%

平均页面访问数

5.7

平均访问时长

00:06:37

Megatron-LM 访问量趋势

Megatron-LM 访问地理位置分布

Megatron-LM 流量来源

Megatron-LM 替代品