Llama3-70B-SteerLM-RM

Modelo de Recompensa Multifacetado com 70 bilhões de parâmetros

Produto ComumProgramaçãoIAModelo de Linguagem
O Llama3-70B-SteerLM-RM é um modelo de linguagem com 70 bilhões de parâmetros, usado como modelo de previsão de atributos, um modelo de recompensa multifacetado que avalia as respostas do modelo em vários aspectos, em vez de uma única pontuação como nos modelos de recompensa tradicionais. O modelo foi treinado usando o conjunto de dados HelpSteer2 e com o NVIDIA NeMo-Aligner, um kit de ferramentas escalável para alinhamento de modelos eficiente e eficaz.
Abrir Site

Llama3-70B-SteerLM-RM Situação do Tráfego Mais Recente

Total de Visitas Mensais

29742941

Taxa de Rejeição

44.20%

Média de Páginas por Visita

5.9

Duração Média da Visita

00:04:44

Llama3-70B-SteerLM-RM Tendência de Visitas

Llama3-70B-SteerLM-RM Distribuição Geográfica das Visitas

Llama3-70B-SteerLM-RM Fontes de Tráfego

Llama3-70B-SteerLM-RM Alternativas