HelpSteer2

Un conjunto de datos de código abierto para entrenar modelos de recompensa de alto rendimiento.

Producto ComúnCódigo AbiertoConjunto de datos de código abiertoModelo de recompensa
HelpSteer2 es un conjunto de datos de código abierto publicado por NVIDIA, diseñado para respaldar el entrenamiento de modelos capaces de alinear modelos para que sean más útiles, veraces y coherentes, con una complejidad y redundancia ajustables en sus respuestas. Creado en colaboración con Scale AI, al utilizarlo con el modelo base Llama 3 70B, alcanzó un rendimiento del 88,8% en RewardBench, siendo uno de los mejores modelos de recompensa hasta el 12 de junio de 2024.
Abrir sitio web

HelpSteer2 Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

HelpSteer2 Tendencia de visitas

HelpSteer2 Distribución geográfica de las visitas

HelpSteer2 Fuentes de tráfico