InternVL2_5-1B

Multimodales großes Sprachmodell, das Bild- und Textverständnis unterstützt.

Normales ProduktBildMultimodalGroßes Sprachmodell
InternVL 2.5 ist eine Reihe fortschrittlicher multimodaler großer Sprachmodelle (MLLM), die auf InternVL 2.0 aufbaut. Durch die Einführung signifikanter Verbesserungen der Trainings- und Teststrategien sowie der Datenqualität wurde die Kernmodellarchitektur beibehalten. Das Modell integriert das neu hinzugefügte, vorab trainierte InternViT mit verschiedenen vorab trainierten großen Sprachmodellen (LLMs) wie InternLM 2.5 und Qwen 2.5, wobei ein zufällig initialisierter MLP-Projektor verwendet wird. InternVL 2.5 unterstützt Multi-Bild- und Videodaten und verbessert durch dynamische hochauflösende Trainingsmethoden die Fähigkeit des Modells zur Verarbeitung multimodaler Daten.
Website öffnen

InternVL2_5-1B Neueste Verkehrssituation

Monatliche Gesamtbesuche

29742941

Absprungrate

44.20%

Durchschnittliche Seiten pro Besuch

5.9

Durchschnittliche Besuchsdauer

00:04:44

InternVL2_5-1B Besuchstrend

InternVL2_5-1B Geografische Verteilung der Besuche

InternVL2_5-1B Traffic-Quellen

InternVL2_5-1B Alternativen