InternVL2_5-26B
Großes multimodales Sprachmodell, das visuelle und sprachliche Verständnisse integriert.
Normales ProduktBildMultimodalGroßes Sprachmodell
InternVL2_5-26B ist ein fortschrittliches großes multimodales Sprachmodell (MLLM), das auf InternVL 2.0 aufbaut und durch die Einführung deutlich verbesserter Trainings- und Teststrategien sowie eine höhere Datenqualität weiterentwickelt wurde. Das Modell behält die Kernarchitektur seines Vorgängers „ViT-MLP-LLM“ bei und integriert neu hinzugefügte, vortrainierte InternViT-Modelle und verschiedene vortrainierte große Sprachmodelle (LLMs), wie z. B. InternLM 2.5 und Qwen 2.5, unter Verwendung von zufällig initialisierten MLP-Projektoren. Die Modelle der InternVL 2.5-Serie zeigen eine hervorragende Leistung bei multimodalen Aufgaben, insbesondere in Bezug auf visuelle Wahrnehmung und multimodale Fähigkeiten.
InternVL2_5-26B Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44