ScholarQABench
Plateforme d'évaluation globale de la littérature scientifique
Produit OrdinaireAutreLittérature scientifiquePlateforme d'évaluation
ScholarQABench est une plateforme d'évaluation globale conçue pour tester les capacités des grands modèles de langage (LLM) à aider les chercheurs dans la synthèse de la littérature scientifique. Issu du projet OpenScholar, il fournit un cadre d'évaluation complet, comprenant plusieurs ensembles de données et scripts d'évaluation, afin de mesurer les performances des modèles dans différents domaines scientifiques. L'importance de cette plateforme réside dans sa capacité à aider les chercheurs et les développeurs à comprendre et à améliorer l'utilité et la précision des modèles linguistiques dans la recherche scientifique.
ScholarQABench Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34