InternVL2_5-8B

Multimodales großes Sprachmodell, das interaktives Verständnis von Bildern und Text unterstützt.

Normales ProduktBildMultimodalGroßes Sprachmodell
InternVL2_5-8B ist ein von OpenGVLab entwickeltes multimodales großes Sprachmodell (MLLM), das auf Basis von InternVL 2.0 durch deutlich verbesserte Trainings- und Teststrategien sowie höhere Datenqualität optimiert wurde. Das Modell verwendet die Architektur 'ViT-MLP-LLM' und integriert einen inkrementell vortrainierten InternViT mit verschiedenen vortrainierten Sprachmodellen wie InternLM 2.5 und Qwen 2.5, wobei ein MLP-Projektor mit zufälliger Initialisierung verwendet wird. Die Modelle der InternVL 2.5-Serie zeigen eine herausragende Leistung bei multimodale Aufgaben, darunter Bild- und Videoverständnis sowie mehrsprachiges Verständnis.
Website öffnen

InternVL2_5-8B Neueste Verkehrssituation

Monatliche Gesamtbesuche

29742941

Absprungrate

44.20%

Durchschnittliche Seiten pro Besuch

5.9

Durchschnittliche Besuchsdauer

00:04:44

InternVL2_5-8B Besuchstrend

InternVL2_5-8B Geografische Verteilung der Besuche

InternVL2_5-8B Traffic-Quellen

InternVL2_5-8B Alternativen