InternVL2_5-1B
Multimodales großes Sprachmodell, das Bild- und Textverständnis unterstützt.
Normales ProduktBildMultimodalGroßes Sprachmodell
InternVL 2.5 ist eine Reihe fortschrittlicher multimodaler großer Sprachmodelle (MLLM), die auf InternVL 2.0 aufbaut. Durch die Einführung signifikanter Verbesserungen der Trainings- und Teststrategien sowie der Datenqualität wurde die Kernmodellarchitektur beibehalten. Das Modell integriert das neu hinzugefügte, vorab trainierte InternViT mit verschiedenen vorab trainierten großen Sprachmodellen (LLMs) wie InternLM 2.5 und Qwen 2.5, wobei ein zufällig initialisierter MLP-Projektor verwendet wird. InternVL 2.5 unterstützt Multi-Bild- und Videodaten und verbessert durch dynamische hochauflösende Trainingsmethoden die Fähigkeit des Modells zur Verarbeitung multimodaler Daten.
InternVL2_5-1B Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44