InternVL2_5-8B
Multimodales großes Sprachmodell, das interaktives Verständnis von Bildern und Text unterstützt.
Normales ProduktBildMultimodalGroßes Sprachmodell
InternVL2_5-8B ist ein von OpenGVLab entwickeltes multimodales großes Sprachmodell (MLLM), das auf Basis von InternVL 2.0 durch deutlich verbesserte Trainings- und Teststrategien sowie höhere Datenqualität optimiert wurde. Das Modell verwendet die Architektur 'ViT-MLP-LLM' und integriert einen inkrementell vortrainierten InternViT mit verschiedenen vortrainierten Sprachmodellen wie InternLM 2.5 und Qwen 2.5, wobei ein MLP-Projektor mit zufälliger Initialisierung verwendet wird. Die Modelle der InternVL 2.5-Serie zeigen eine herausragende Leistung bei multimodale Aufgaben, darunter Bild- und Videoverständnis sowie mehrsprachiges Verständnis.
InternVL2_5-8B Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44