DeepSeek-VL2
Modèle avancé de compréhension multimodale, fusionnant les capacités visuelles et linguistiques.
Produit OrdinaireImageModèle linguistique visuelCompréhension multimodale
DeepSeek-VL2 est une série de grands modèles linguistiques visuels Mixture-of-Experts, représentant une amélioration significative par rapport à la génération précédente, DeepSeek-VL. Cette série de modèles démontre des capacités exceptionnelles dans des tâches telles que la question-réponse visuelle, la reconnaissance optique de caractères, la compréhension de documents/tableaux/graphiques et la localisation visuelle. DeepSeek-VL2 comprend trois variantes : DeepSeek-VL2-Tiny, DeepSeek-VL2-Small et DeepSeek-VL2, possédant respectivement 1,0 milliard, 2,8 milliards et 4,5 milliards de paramètres activés. DeepSeek-VL2 atteint des performances compétitives ou de pointe par rapport aux modèles de base open source denses et MoE existants, avec un nombre de paramètres activés similaire ou inférieur.
DeepSeek-VL2 Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34