HelpSteer2
Um conjunto de dados de código aberto usado para treinar modelos de recompensa de alto desempenho.
Produto ComumCódigo AbertoConjunto de dados de código abertoModelo de recompensa
HelpSteer2 é um conjunto de dados de código aberto lançado pela NVIDIA, projetado para auxiliar no treinamento de modelos alinhados para serem mais úteis, factuais e coerentes, com ajuste na complexidade e redundância das respostas. Criado em colaboração com a Scale AI, atingiu 88,8% no RewardBench quando usado com o modelo base Llama 3 70B, sendo um dos melhores modelos de recompensa até 12 de junho de 2024.
HelpSteer2 Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44