Prometheus-Eval
Ensemble d'outils open source pour l'évaluation d'autres modèles linguistiques
Produit OrdinaireProgrammationOpen sourceModèle linguistique
Prometheus-Eval est un ensemble d'outils open source conçu pour évaluer les performances des grands modèles linguistiques (LLM) dans les tâches de génération. Il offre une interface simple utilisant le modèle Prometheus pour évaluer les instructions et les réponses correspondantes. Le modèle Prometheus 2 supporte l'évaluation directe (notation absolue) et le classement par paires (notation relative), permettant de simuler le jugement humain et les évaluations propriétaires basées sur les modèles linguistiques. Il résout ainsi les problèmes d'équité, de contrôlabilité et de coût.
Prometheus-Eval Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34