Video-CCAM
Modèle vidéo multilingue léger et flexible développé par l'équipe de recherche multimédia de Tencent QQ.
Produit OrdinaireVidéoCompréhension vidéoModèle multilingue
Video-CCAM est une série de modèles vidéo multilingues flexibles (Video-MLLM) développés par l'équipe de recherche multimédia de Tencent QQ, visant à améliorer la compréhension vidéo-langage, particulièrement adaptée à l'analyse de vidéos courtes et longues. Il atteint cet objectif grâce à des masques d'attention croisée causale (Causal Cross-Attention Masks). Video-CCAM excelle dans plusieurs tests de référence, notamment MVBench, VideoVista et MLVU. Le code source du modèle a été réécrit pour simplifier le processus de déploiement.
Video-CCAM Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34