HelpSteer2は、NVIDIAが公開したオープンソースデータセットです。モデルをより有益で、事実的で、首尾一貫したものにするために、応答の複雑さと冗長性を調整しながらモデルを調整するトレーニングを支援することを目的としています。Scale AIとの協力により作成され、Llama 3 70Bベースモデルと共に使用した場合、RewardBenchで88.8%の性能を達成し、2024年6月12日時点で最高の報酬モデルの一つとなっています。