वीडियो-CCAM

टेनसेंट QQ मल्टीमीडिया अनुसंधान दल द्वारा विकसित एक हल्का और लचीला बहुभाषी वीडियो मॉडल

सामान्य उत्पादवीडियोवीडियो समझबहुभाषी मॉडल
वीडियो-CCAM टेनसेंट QQ मल्टीमीडिया अनुसंधान दल द्वारा विकसित बहुभाषी वीडियो मॉडल (Video-MLLM) की एक श्रृंखला है, जिसका उद्देश्य वीडियो-भाषा समझ क्षमता को बढ़ाना है, विशेष रूप से लघु वीडियो और लंबे वीडियो के विश्लेषण के लिए उपयुक्त है। यह इस लक्ष्य को प्राप्त करने के लिए कार्यात्मक क्रॉस-ध्यान मास्क (Causal Cross-Attention Masks) का उपयोग करता है। वीडियो-CCAM ने कई बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन किया है, विशेष रूप से MVBench, VideoVista और MLVU पर। परिनियोजन प्रक्रिया को सरल बनाने के लिए मॉडल के सोर्स कोड को फिर से लिखा गया है।
वेबसाइट खोलें

वीडियो-CCAM नवीनतम ट्रैफ़िक स्थिति

मासिक कुल विज़िट

474564576

बाउंस दर

36.20%

प्रति विज़िट औसत पृष्ठ

6.1

औसत विज़िट अवधि

00:06:34

वीडियो-CCAM विज़िट प्रवृत्ति

वीडियो-CCAM विज़िट भौगोलिक वितरण

वीडियो-CCAM ट्रैफ़िक स्रोत

वीडियो-CCAM विकल्प