Nemotron-4-340B-Reward
Modèle de récompense multidimensionnel pour la création de grands modèles linguistiques personnalisés.
Produit OrdinaireProgrammationIAGrands modèles linguistiques
Nemotron-4-340B-Reward est un modèle de récompense multidimensionnel développé par NVIDIA pour les pipelines de génération de données synthétiques. Il aide les chercheurs et les développeurs à construire leurs propres grands modèles linguistiques (LLM). Ce modèle, composé du modèle Nemotron-4-340B-Base et d'une couche linéaire, convertit les jetons de fin de réponse en cinq valeurs scalaires correspondant aux attributs HelpSteer2. Il prend en charge une longueur de contexte allant jusqu'à 4096 jetons et peut évaluer cinq attributs pour chaque tour d'assistant.
Nemotron-4-340B-Reward Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44