Llama3-70B-SteerLM-RM
Modelo de Recompensa Multifacetado com 70 bilhões de parâmetros
Produto ComumProgramaçãoIAModelo de Linguagem
O Llama3-70B-SteerLM-RM é um modelo de linguagem com 70 bilhões de parâmetros, usado como modelo de previsão de atributos, um modelo de recompensa multifacetado que avalia as respostas do modelo em vários aspectos, em vez de uma única pontuação como nos modelos de recompensa tradicionais. O modelo foi treinado usando o conjunto de dados HelpSteer2 e com o NVIDIA NeMo-Aligner, um kit de ferramentas escalável para alinhamento de modelos eficiente e eficaz.
Llama3-70B-SteerLM-RM Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44