InternVL2_5-2B
Großes multimodales Sprachmodell, das eine tiefgreifende Interaktion zwischen Bildern und Text unterstützt.
Normales ProduktBildMultimodalGroßes Sprachmodell
InternVL 2.5 ist eine fortschrittliche Serie großer multimodaler Sprachmodelle. Aufbauend auf InternVL 2.0 wurde es durch die Einführung deutlich verbesserter Trainings- und Teststrategien sowie einer höheren Datenqualität weiterentwickelt, wobei die Kernarchitektur des Modells beibehalten wurde. Das Modell integriert das neu vortrainierte InternViT mit verschiedenen vortrainierten großen Sprachmodellen, wie InternLM 2.5 und Qwen 2.5, unter Verwendung eines zufällig initialisierten MLP-Projektors. InternVL 2.5 unterstützt Multi-Bild- und Videodaten und verfügt über eine dynamische hochauflösende Trainingsmethode, die eine bessere Leistung bei der Verarbeitung multimodaler Daten ermöglicht.
InternVL2_5-2B Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44