Évaluation factuelle FACTS
Dernier benchmark pour évaluer la fidélité factuelle des grands modèles linguistiques.
Produit OrdinaireAutreIAModèle linguistique
FACTS Grounding est un benchmark complet mis au point par Google DeepMind pour évaluer si les réponses générées par les grands modèles linguistiques (LLM) sont non seulement factuellement exactes au regard de l'entrée fournie, mais aussi suffisamment détaillées pour fournir une réponse satisfaisante à l'utilisateur. Ce benchmark est crucial pour améliorer la fiabilité et la précision des LLM dans leurs applications du monde réel, et contribue à faire progresser l'ensemble du secteur en matière de fidélité factuelle et de fondement.
Évaluation factuelle FACTS Dernière situation du trafic
Nombre total de visites mensuelles
3157624
Taux de rebond
67.99%
Nombre moyen de pages par visite
1.6
Durée moyenne de la visite
00:01:09