HelpSteer2

一个用于训练高性能奖励模型的开源数据集。

普通产品开源开源数据集奖励模型
HelpSteer2是由NVIDIA发布的一个开源数据集,旨在支持训练能够对齐模型以使其更加有帮助、事实正确和连贯,同时在响应的复杂性和冗余度方面具有可调节性。该数据集与Scale AI合作创建,当与Llama 3 70B基础模型一起使用时,在RewardBench上达到了88.8%的表现,是截至2024年6月12日最佳的奖励模型之一。
打开网站

HelpSteer2 最新流量情况

月总访问量

20899836

跳出率

46.04%

平均页面访问数

5.2

平均访问时长

00:04:57

HelpSteer2 访问量趋势

HelpSteer2 访问地理位置分布

HelpSteer2 流量来源

HelpSteer2 替代品