InternViT-6B-448px-V2_5

Verbessertes visuelles Modell basierend auf InternViT-6B-448px-V1-5

Normales ProduktBildVisuelles ModellMerkmalsextraktion
InternViT-6B-448px-V2_5 ist ein visuelles Modell, das auf InternViT-6B-448px-V1-5 basiert. Durch den Einsatz von inkrementellem ViT-Lernen und NTP-Verlust (Phase 1.5) wurde die Fähigkeit des visuellen Encoders zur Extraktion visueller Merkmale verbessert, insbesondere in Bereichen mit unzureichender Repräsentation in großen Netzwerk-Datensätzen, wie z. B. mehrsprachigen OCR-Daten und mathematischen Diagrammen. Das Modell ist Teil der InternVL 2.5-Serie und behält die gleiche „ViT-MLP-LLM“-Modellarchitektur wie seine Vorgänger bei. Es integriert ein neu inkrementell vortrainiertes InternViT mit verschiedenen vortrainierten LLMs, darunter InternLM 2.5 und Qwen 2.5, wobei ein zufällig initialisierter MLP-Projektor verwendet wird.
Website öffnen

InternViT-6B-448px-V2_5 Neueste Verkehrssituation

Monatliche Gesamtbesuche

29742941

Absprungrate

44.20%

Durchschnittliche Seiten pro Besuch

5.9

Durchschnittliche Besuchsdauer

00:04:44

InternViT-6B-448px-V2_5 Besuchstrend

InternViT-6B-448px-V2_5 Geografische Verteilung der Besuche

InternViT-6B-448px-V2_5 Traffic-Quellen

InternViT-6B-448px-V2_5 Alternativen