Nemotron-4-340B-Reward

多维奖励模型,助力构建自定义大型语言模型。

普通产品编程大型语言模型合成数据生成
Nemotron-4-340B-Reward是由NVIDIA开发的多维奖励模型,用于合成数据生成管道,帮助研究人员和开发者构建自己的大型语言模型(LLMs)。该模型由Nemotron-4-340B-Base模型和一个线性层组成,能够将响应末尾的标记转换为五个标量值,对应于HelpSteer2属性。它支持最多4096个标记的上下文长度,并能够对每个助手轮次的五个属性进行评分。
打开网站

Nemotron-4-340B-Reward 最新流量情况

月总访问量

18200568

跳出率

44.11%

平均页面访问数

5.8

平均访问时长

00:05:46

Nemotron-4-340B-Reward 访问量趋势

Nemotron-4-340B-Reward 访问地理位置分布

Nemotron-4-340B-Reward 流量来源

Nemotron-4-340B-Reward 替代品