MMStar
Un ensemble de référence d'élite pour l'évaluation des grands modèles linguistiques visuels.
Produit OrdinaireProductivitéModèle linguistique visuelÉvaluation comparative
MMStar est un ensemble de référence conçu pour évaluer les capacités multimodales des grands modèles linguistiques visuels. Il contient 1500 exemples visuels et linguistiques soigneusement sélectionnés, couvrant 6 capacités principales et 18 dimensions détaillées. Chaque exemple a été revu manuellement pour garantir sa dépendance visuelle, minimiser les fuites de données et nécessiter des capacités multimodales avancées pour sa résolution. Au-delà des indicateurs de précision traditionnels, MMStar propose deux nouveaux indicateurs pour mesurer les fuites de données et le gain de performance réel de l'entraînement multimodal. Les chercheurs peuvent utiliser MMStar pour évaluer les capacités multimodales des modèles linguistiques visuels sur plusieurs tâches et, grâce à ces nouveaux indicateurs, identifier les problèmes potentiels des modèles.
MMStar Dernière situation du trafic
Nombre total de visites mensuelles
62
Taux de rebond
46.00%
Nombre moyen de pages par visite
1.0
Durée moyenne de la visite
00:00:00