InternViT-6B-448px-V2_5
Verbessertes visuelles Modell basierend auf InternViT-6B-448px-V1-5
Normales ProduktBildVisuelles ModellMerkmalsextraktion
InternViT-6B-448px-V2_5 ist ein visuelles Modell, das auf InternViT-6B-448px-V1-5 basiert. Durch den Einsatz von inkrementellem ViT-Lernen und NTP-Verlust (Phase 1.5) wurde die Fähigkeit des visuellen Encoders zur Extraktion visueller Merkmale verbessert, insbesondere in Bereichen mit unzureichender Repräsentation in großen Netzwerk-Datensätzen, wie z. B. mehrsprachigen OCR-Daten und mathematischen Diagrammen. Das Modell ist Teil der InternVL 2.5-Serie und behält die gleiche „ViT-MLP-LLM“-Modellarchitektur wie seine Vorgänger bei. Es integriert ein neu inkrementell vortrainiertes InternViT mit verschiedenen vortrainierten LLMs, darunter InternLM 2.5 und Qwen 2.5, wobei ein zufällig initialisierter MLP-Projektor verwendet wird.
InternViT-6B-448px-V2_5 Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44