HelpSteer2
Un conjunto de datos de código abierto para entrenar modelos de recompensa de alto rendimiento.
Producto ComúnCódigo AbiertoConjunto de datos de código abiertoModelo de recompensa
HelpSteer2 es un conjunto de datos de código abierto publicado por NVIDIA, diseñado para respaldar el entrenamiento de modelos capaces de alinear modelos para que sean más útiles, veraces y coherentes, con una complejidad y redundancia ajustables en sus respuestas. Creado en colaboración con Scale AI, al utilizarlo con el modelo base Llama 3 70B, alcanzó un rendimiento del 88,8% en RewardBench, siendo uno de los mejores modelos de recompensa hasta el 12 de junio de 2024.
HelpSteer2 Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44