InternVL2_5-2B

Großes multimodales Sprachmodell, das eine tiefgreifende Interaktion zwischen Bildern und Text unterstützt.

Normales ProduktBildMultimodalGroßes Sprachmodell
InternVL 2.5 ist eine fortschrittliche Serie großer multimodaler Sprachmodelle. Aufbauend auf InternVL 2.0 wurde es durch die Einführung deutlich verbesserter Trainings- und Teststrategien sowie einer höheren Datenqualität weiterentwickelt, wobei die Kernarchitektur des Modells beibehalten wurde. Das Modell integriert das neu vortrainierte InternViT mit verschiedenen vortrainierten großen Sprachmodellen, wie InternLM 2.5 und Qwen 2.5, unter Verwendung eines zufällig initialisierten MLP-Projektors. InternVL 2.5 unterstützt Multi-Bild- und Videodaten und verfügt über eine dynamische hochauflösende Trainingsmethode, die eine bessere Leistung bei der Verarbeitung multimodaler Daten ermöglicht.
Website öffnen

InternVL2_5-2B Neueste Verkehrssituation

Monatliche Gesamtbesuche

29742941

Absprungrate

44.20%

Durchschnittliche Seiten pro Besuch

5.9

Durchschnittliche Besuchsdauer

00:04:44

InternVL2_5-2B Besuchstrend

InternVL2_5-2B Geografische Verteilung der Besuche

InternVL2_5-2B Traffic-Quellen

InternVL2_5-2B Alternativen