HelpSteer2
Ein quelloffener Datensatz zum Trainieren leistungsstarker Belohnungsmodelle.
Normales ProduktOpen SourceQuelloffener DatensatzBelohnungsmodell
HelpSteer2 ist ein von NVIDIA veröffentlichter, quelloffener Datensatz, der die Entwicklung von Modellen unterstützen soll, die besser darin sind, hilfreich, sachlich korrekt und kohärent zu sein, wobei gleichzeitig die Komplexität und Redundanz der Antworten anpassbar ist. In Zusammenarbeit mit Scale AI erstellt, erreicht er auf RewardBench 88,8 % in Verbindung mit dem Llama 3 70B Basismodell – Stand 12. Juni 2024 eines der besten Belohnungsmodelle.
HelpSteer2 Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44