Nemotron-4-340B-Reward

Modèle de récompense multidimensionnel pour la création de grands modèles linguistiques personnalisés.

Produit OrdinaireProgrammationIAGrands modèles linguistiques
Nemotron-4-340B-Reward est un modèle de récompense multidimensionnel développé par NVIDIA pour les pipelines de génération de données synthétiques. Il aide les chercheurs et les développeurs à construire leurs propres grands modèles linguistiques (LLM). Ce modèle, composé du modèle Nemotron-4-340B-Base et d'une couche linéaire, convertit les jetons de fin de réponse en cinq valeurs scalaires correspondant aux attributs HelpSteer2. Il prend en charge une longueur de contexte allant jusqu'à 4096 jetons et peut évaluer cinq attributs pour chaque tour d'assistant.
Ouvrir le site Web

Nemotron-4-340B-Reward Dernière situation du trafic

Nombre total de visites mensuelles

29742941

Taux de rebond

44.20%

Nombre moyen de pages par visite

5.9

Durée moyenne de la visite

00:04:44

Nemotron-4-340B-Reward Tendance des visites

Nemotron-4-340B-Reward Distribution géographique des visites

Nemotron-4-340B-Reward Sources de trafic

Nemotron-4-340B-Reward Alternatives