Nemotron-4-340B-Reward

Modelo de recompensa multidimensional que auxilia na construção de modelos de linguagem grandes personalizados.

Produto ComumProgramaçãoIAModelos de Linguagem Grandes
O Nemotron-4-340B-Reward é um modelo de recompensa multidimensional desenvolvido pela NVIDIA, usado em pipelines de geração de dados sintéticos para ajudar pesquisadores e desenvolvedores a construir seus próprios modelos de linguagem grandes (LLMs). O modelo consiste no modelo Nemotron-4-340B-Base e uma camada linear, capaz de converter tokens no final de uma resposta em cinco valores escalares, correspondentes às propriedades do HelpSteer2. Ele suporta um comprimento de contexto de até 4096 tokens e pode avaliar cinco atributos para cada turno do assistente.
Abrir Site

Nemotron-4-340B-Reward Situação do Tráfego Mais Recente

Total de Visitas Mensais

29742941

Taxa de Rejeição

44.20%

Média de Páginas por Visita

5.9

Duração Média da Visita

00:04:44

Nemotron-4-340B-Reward Tendência de Visitas

Nemotron-4-340B-Reward Distribuição Geográfica das Visitas

Nemotron-4-340B-Reward Fontes de Tráfego

Nemotron-4-340B-Reward Alternativas