DeepSeek-VL2

Ein fortschrittliches multimodalen Verständnismodell, das visuelle und sprachliche Fähigkeiten vereint.

Normales ProduktBildBild-SprachmodellMultimodales Verständnis
DeepSeek-VL2 ist eine Reihe großer Mixture-of-Experts-Bild-Sprachmodelle, die im Vergleich zum Vorgänger DeepSeek-VL deutliche Verbesserungen aufweisen. Die Modellreihe zeigt herausragende Fähigkeiten in Aufgaben wie visuelle Fragebeantwortung, optische Zeichenerkennung, Dokument-/Tabellen-/Diagrammverständnis und visuelle Lokalisierung. DeepSeek-VL2 umfasst drei Varianten: DeepSeek-VL2-Tiny, DeepSeek-VL2-Small und DeepSeek-VL2 mit 1,0 B, 2,8 B bzw. 4,5 B Aktivierungsparametern. DeepSeek-VL2 erreicht bei ähnlicher oder geringerer Anzahl an Aktivierungsparametern eine wettbewerbsfähige oder sogar state-of-the-art Leistung im Vergleich zu bestehenden Open-Source-dichten und MoE-Basismodellen.
Website öffnen

DeepSeek-VL2 Neueste Verkehrssituation

Monatliche Gesamtbesuche

474564576

Absprungrate

36.20%

Durchschnittliche Seiten pro Besuch

6.1

Durchschnittliche Besuchsdauer

00:06:34

DeepSeek-VL2 Besuchstrend

DeepSeek-VL2 Geografische Verteilung der Besuche

DeepSeek-VL2 Traffic-Quellen

DeepSeek-VL2 Alternativen