HelpSteer2 NVIDIA द्वारा जारी किया गया एक ओपन-सोर्स डेटासेट है, जिसका उद्देश्य मॉडल को संरेखित करने के लिए प्रशिक्षण का समर्थन करना है ताकि वे अधिक सहायक, तथ्यात्मक रूप से सही और सुसंगत हों, साथ ही प्रतिक्रिया की जटिलता और अतिरेक के संबंध में समायोज्यता भी हो। यह डेटासेट Scale AI के सहयोग से बनाया गया है, और जब Llama 3 70B बेस मॉडल के साथ उपयोग किया जाता है, तो यह RewardBench पर 88.8% का प्रदर्शन प्राप्त करता है, जो 12 जून, 2024 तक सर्वश्रेष्ठ पुरस्कार मॉडल में से एक है।