HelpSteer2

Um conjunto de dados de código aberto usado para treinar modelos de recompensa de alto desempenho.

Produto ComumCódigo AbertoConjunto de dados de código abertoModelo de recompensa
HelpSteer2 é um conjunto de dados de código aberto lançado pela NVIDIA, projetado para auxiliar no treinamento de modelos alinhados para serem mais úteis, factuais e coerentes, com ajuste na complexidade e redundância das respostas. Criado em colaboração com a Scale AI, atingiu 88,8% no RewardBench quando usado com o modelo base Llama 3 70B, sendo um dos melhores modelos de recompensa até 12 de junho de 2024.
Abrir Site

HelpSteer2 Situação do Tráfego Mais Recente

Total de Visitas Mensais

29742941

Taxa de Rejeição

44.20%

Média de Páginas por Visita

5.9

Duração Média da Visita

00:04:44

HelpSteer2 Tendência de Visitas

HelpSteer2 Distribuição Geográfica das Visitas

HelpSteer2 Fontes de Tráfego