InternVL2_5-26B

Großes multimodales Sprachmodell, das visuelle und sprachliche Verständnisse integriert.

Normales ProduktBildMultimodalGroßes Sprachmodell
InternVL2_5-26B ist ein fortschrittliches großes multimodales Sprachmodell (MLLM), das auf InternVL 2.0 aufbaut und durch die Einführung deutlich verbesserter Trainings- und Teststrategien sowie eine höhere Datenqualität weiterentwickelt wurde. Das Modell behält die Kernarchitektur seines Vorgängers „ViT-MLP-LLM“ bei und integriert neu hinzugefügte, vortrainierte InternViT-Modelle und verschiedene vortrainierte große Sprachmodelle (LLMs), wie z. B. InternLM 2.5 und Qwen 2.5, unter Verwendung von zufällig initialisierten MLP-Projektoren. Die Modelle der InternVL 2.5-Serie zeigen eine hervorragende Leistung bei multimodalen Aufgaben, insbesondere in Bezug auf visuelle Wahrnehmung und multimodale Fähigkeiten.
Website öffnen

InternVL2_5-26B Neueste Verkehrssituation

Monatliche Gesamtbesuche

29742941

Absprungrate

44.20%

Durchschnittliche Seiten pro Besuch

5.9

Durchschnittliche Besuchsdauer

00:04:44

InternVL2_5-26B Besuchstrend

InternVL2_5-26B Geografische Verteilung der Besuche

InternVL2_5-26B Traffic-Quellen

InternVL2_5-26B Alternativen