MAVIS
Mathematisch-visuelles, durch Instruktion optimiertes Modell
Normales ProduktProduktivitätMaschinelles LernenMultimodales Lernen
MAVIS ist ein mathematisch-visuelles, durch Instruktion optimiertes Modell für multimodal große Sprachmodelle (MLLMs). Es verbessert die Fähigkeiten von MLLMs in der Lösung visueller mathematischer Probleme, indem es die visuelle Kodierung mathematischer Diagramme, die Ausrichtung von Diagrammen und Sprache sowie die mathematischen Schlussfolgerungsfähigkeiten verbessert. Das Modell umfasst zwei neu kuratierte Datensätze, einen mathematisch-visuellen Kodierer und ein mathematisches MLLM, das durch ein dreistufiges Trainingsverfahren Spitzenleistungen im MathVerse-Benchmark erzielt.
MAVIS Neueste Verkehrssituation
Monatliche Gesamtbesuche
474564576
Absprungrate
36.20%
Durchschnittliche Seiten pro Besuch
6.1
Durchschnittliche Besuchsdauer
00:06:34