MMStar

Un ensemble de référence d'élite pour l'évaluation des grands modèles linguistiques visuels.

Produit OrdinaireProductivitéModèle linguistique visuelÉvaluation comparative
MMStar est un ensemble de référence conçu pour évaluer les capacités multimodales des grands modèles linguistiques visuels. Il contient 1500 exemples visuels et linguistiques soigneusement sélectionnés, couvrant 6 capacités principales et 18 dimensions détaillées. Chaque exemple a été revu manuellement pour garantir sa dépendance visuelle, minimiser les fuites de données et nécessiter des capacités multimodales avancées pour sa résolution. Au-delà des indicateurs de précision traditionnels, MMStar propose deux nouveaux indicateurs pour mesurer les fuites de données et le gain de performance réel de l'entraînement multimodal. Les chercheurs peuvent utiliser MMStar pour évaluer les capacités multimodales des modèles linguistiques visuels sur plusieurs tâches et, grâce à ces nouveaux indicateurs, identifier les problèmes potentiels des modèles.
Ouvrir le site Web

MMStar Dernière situation du trafic

Nombre total de visites mensuelles

62

Taux de rebond

46.00%

Nombre moyen de pages par visite

1.0

Durée moyenne de la visite

00:00:00

MMStar Tendance des visites

MMStar Distribution géographique des visites

MMStar Sources de trafic

MMStar Alternatives