DeepSeek-VL2

Modelo de comprensión multimodal avanzado que integra capacidades visuales y lingüísticas.

Producto ComúnImagenModelo de lenguaje visualComprensión multimodal
DeepSeek-VL2 es una serie de grandes modelos de lenguaje visual Mixture-of-Experts (MoE), con mejoras significativas respecto a su predecesor, DeepSeek-VL. Esta serie de modelos demuestra una capacidad excepcional en tareas como respuesta a preguntas visuales, reconocimiento óptico de caracteres (OCR), comprensión de documentos/tablas/gráficos y localización visual. DeepSeek-VL2 incluye tres variantes: DeepSeek-VL2-Tiny, DeepSeek-VL2-Small y DeepSeek-VL2, con 1.0B, 2.8B y 4.5B parámetros de activación, respectivamente. DeepSeek-VL2 alcanza un rendimiento competitivo o de vanguardia en comparación con los modelos base de MoE y densos de código abierto existentes, con un número similar o menor de parámetros de activación.
Abrir sitio web

DeepSeek-VL2 Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

DeepSeek-VL2 Tendencia de visitas

DeepSeek-VL2 Distribución geográfica de las visitas

DeepSeek-VL2 Fuentes de tráfico

DeepSeek-VL2 Alternativas