HelpSteer2
Un ensemble de données open source utilisé pour entraîner des modèles de récompense haute performance.
Produit OrdinaireOpen SourceEnsemble de données open sourceModèle de récompense
HelpSteer2 est un ensemble de données open source publié par NVIDIA, visant à soutenir l'entraînement de modèles capables d'aligner les modèles pour les rendre plus utiles, factuellement corrects et cohérents, tout en offrant une régulation de la complexité et de la redondance des réponses. Créé en collaboration avec Scale AI, il a atteint 88,8 % de performance sur RewardBench lorsqu'il est utilisé avec le modèle de base Llama 3 70B, faisant de lui l'un des meilleurs modèles de récompense au 12 juin 2024.
HelpSteer2 Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44