Apollo-LMMs
Erforschung des Videoverständnisses in großen multimodalen Modellen
Normales ProduktVideoVideoverständnisMultimodale Modelle
Apollo ist eine Familie fortschrittlicher, großer multimodaler Modelle, die sich auf das Videoverständnis konzentrieren. Durch die systematische Erforschung des Designspaces von Video-LMMs werden die entscheidenden Leistungsfaktoren aufgedeckt und praktische Einblicke in die Optimierung der Modellleistung bereitgestellt. Apollo ermöglicht durch die Entdeckung der 'Scaling Consistency', dass Designentscheidungen, die an kleineren Modellen und Datensätzen getroffen werden, zuverlässig auf größere Modelle übertragen werden können, wodurch die Rechenkosten erheblich reduziert werden. Zu den Hauptvorteilen von Apollo gehören effiziente Designentscheidungen, optimierte Trainingspläne und Datenmischungen sowie ein neuartiger Benchmark, ApolloBench, zur effizienten Bewertung.
Apollo-LMMs Neueste Verkehrssituation
Monatliche Gesamtbesuche
1938
Absprungrate
70.30%
Durchschnittliche Seiten pro Besuch
1.0
Durchschnittliche Besuchsdauer
00:00:00