Video-CCAM

Modèle vidéo multilingue léger et flexible développé par l'équipe de recherche multimédia de Tencent QQ.

Produit OrdinaireVidéoCompréhension vidéoModèle multilingue
Video-CCAM est une série de modèles vidéo multilingues flexibles (Video-MLLM) développés par l'équipe de recherche multimédia de Tencent QQ, visant à améliorer la compréhension vidéo-langage, particulièrement adaptée à l'analyse de vidéos courtes et longues. Il atteint cet objectif grâce à des masques d'attention croisée causale (Causal Cross-Attention Masks). Video-CCAM excelle dans plusieurs tests de référence, notamment MVBench, VideoVista et MLVU. Le code source du modèle a été réécrit pour simplifier le processus de déploiement.
Ouvrir le site Web

Video-CCAM Dernière situation du trafic

Nombre total de visites mensuelles

474564576

Taux de rebond

36.20%

Nombre moyen de pages par visite

6.1

Durée moyenne de la visite

00:06:34

Video-CCAM Tendance des visites

Video-CCAM Distribution géographique des visites

Video-CCAM Sources de trafic

Video-CCAM Alternatives