Nemotron-4-340B-Reward

Modelo de recompensa multidimensional que facilita la creación de modelos de lenguaje extenso personalizados.

Producto ComúnProgramaciónIAModelos de lenguaje extenso
Nemotron-4-340B-Reward es un modelo de recompensa multidimensional desarrollado por NVIDIA para canalizaciones de generación de datos sintéticos, que ayuda a investigadores y desarrolladores a construir sus propios modelos de lenguaje extenso (LLM). El modelo consta del modelo Nemotron-4-340B-Base y una capa lineal, capaz de convertir las etiquetas al final de una respuesta en cinco valores escalares que corresponden a las propiedades de HelpSteer2. Admite una longitud de contexto de hasta 4096 tokens y puede puntuar cinco atributos de cada turno del asistente.
Abrir sitio web

Nemotron-4-340B-Reward Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

Nemotron-4-340B-Reward Tendencia de visitas

Nemotron-4-340B-Reward Distribución geográfica de las visitas

Nemotron-4-340B-Reward Fuentes de tráfico

Nemotron-4-340B-Reward Alternativas