MAVIS
Modèle d'optimisation d'instructions de vision mathématique
Produit OrdinaireProductivitéMachine LearningApprentissage multi-modal
MAVIS est un modèle d'optimisation d'instructions de vision mathématique pour les grands modèles de langage multimodaux (MLLM). Il améliore les capacités des MLLM en matière de résolution de problèmes mathématiques visuels en améliorant l'encodage visuel des diagrammes mathématiques, l'alignement diagramme-langage et les compétences de raisonnement mathématique. Ce modèle comprend deux nouveaux ensembles de données conçus sur mesure, un encodeur de vision mathématique et un MLLM mathématique, atteignant des performances de pointe sur l'évaluation comparative MathVerse grâce à un paradigme d'entraînement en trois phases.
MAVIS Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34