Llama3-70B-SteerLM-RM

Modèle à récompenses multi-facettes de 70 milliards de paramètres

Produit OrdinaireProgrammationIAModèle linguistique
Llama3-70B-SteerLM-RM est un modèle linguistique de 70 milliards de paramètres, utilisé comme modèle de prédiction d'attributs, un modèle à récompenses multi-facettes qui évalue les réponses du modèle sur plusieurs aspects, plutôt qu'avec un seul score comme les modèles de récompenses traditionnels. Ce modèle est entraîné avec l'ensemble de données HelpSteer2 et via NVIDIA NeMo-Aligner, une boîte à outils évolutive pour un alignement de modèle efficace et performant.
Ouvrir le site Web

Llama3-70B-SteerLM-RM Dernière situation du trafic

Nombre total de visites mensuelles

29742941

Taux de rebond

44.20%

Nombre moyen de pages par visite

5.9

Durée moyenne de la visite

00:04:44

Llama3-70B-SteerLM-RM Tendance des visites

Llama3-70B-SteerLM-RM Distribution géographique des visites

Llama3-70B-SteerLM-RM Sources de trafic

Llama3-70B-SteerLM-RM Alternatives