HelpSteer2 ist ein von NVIDIA veröffentlichter, quelloffener Datensatz, der die Entwicklung von Modellen unterstützen soll, die besser darin sind, hilfreich, sachlich korrekt und kohärent zu sein, wobei gleichzeitig die Komplexität und Redundanz der Antworten anpassbar ist. In Zusammenarbeit mit Scale AI erstellt, erreicht er auf RewardBench 88,8 % in Verbindung mit dem Llama 3 70B Basismodell – Stand 12. Juni 2024 eines der besten Belohnungsmodelle.