HelpSteer2

Un ensemble de données open source utilisé pour entraîner des modèles de récompense haute performance.

Produit OrdinaireOpen SourceEnsemble de données open sourceModèle de récompense
HelpSteer2 est un ensemble de données open source publié par NVIDIA, visant à soutenir l'entraînement de modèles capables d'aligner les modèles pour les rendre plus utiles, factuellement corrects et cohérents, tout en offrant une régulation de la complexité et de la redondance des réponses. Créé en collaboration avec Scale AI, il a atteint 88,8 % de performance sur RewardBench lorsqu'il est utilisé avec le modèle de base Llama 3 70B, faisant de lui l'un des meilleurs modèles de récompense au 12 juin 2024.
Ouvrir le site Web

HelpSteer2 Dernière situation du trafic

Nombre total de visites mensuelles

29742941

Taux de rebond

44.20%

Nombre moyen de pages par visite

5.9

Durée moyenne de la visite

00:04:44

HelpSteer2 Tendance des visites

HelpSteer2 Distribution géographique des visites

HelpSteer2 Sources de trafic