DeepSeek-VL2
Ein fortschrittliches multimodalen Verständnismodell, das visuelle und sprachliche Fähigkeiten vereint.
Normales ProduktBildBild-SprachmodellMultimodales Verständnis
DeepSeek-VL2 ist eine Reihe großer Mixture-of-Experts-Bild-Sprachmodelle, die im Vergleich zum Vorgänger DeepSeek-VL deutliche Verbesserungen aufweisen. Die Modellreihe zeigt herausragende Fähigkeiten in Aufgaben wie visuelle Fragebeantwortung, optische Zeichenerkennung, Dokument-/Tabellen-/Diagrammverständnis und visuelle Lokalisierung. DeepSeek-VL2 umfasst drei Varianten: DeepSeek-VL2-Tiny, DeepSeek-VL2-Small und DeepSeek-VL2 mit 1,0 B, 2,8 B bzw. 4,5 B Aktivierungsparametern. DeepSeek-VL2 erreicht bei ähnlicher oder geringerer Anzahl an Aktivierungsparametern eine wettbewerbsfähige oder sogar state-of-the-art Leistung im Vergleich zu bestehenden Open-Source-dichten und MoE-Basismodellen.
DeepSeek-VL2 Neueste Verkehrssituation
Monatliche Gesamtbesuche
474564576
Absprungrate
36.20%
Durchschnittliche Seiten pro Besuch
6.1
Durchschnittliche Besuchsdauer
00:06:34