वीडियो समझ के क्षेत्र में, पारंपरिक AI मॉडल अक्सर केवल छोटे वीडियो को संभालने में सक्षम होते हैं, जबकि घंटों या उससे अधिक लंबे वीडियो सामग्री का सामना करने पर उन्हें कठिनाई होती है। इसका मुख्य कारण यह है कि इन मॉडल्स को लंबे वीडियो को संभालते समय "शोर और अतिरिक्त" और "मेमोरी और गणना" की सीमाओं का सामना करना पड़ता है। अब, Goldfish नामक एक नई तकनीक ने इस स्थिति को बदल दिया है।

image.png

उत्पाद प्रवेश: https://top.aibase.com/tool/goldfish

Goldfish एक ऐसा तरीका है जिसे किसी भी लंबाई के वीडियो को संभालने के लिए विशेष रूप से डिजाइन किया गया है। यह एक कुशल खोज तंत्र का उपयोग करता है, जो पहले लंबे वीडियो से निर्देश के साथ सबसे संबंधित K वीडियो क्लिप निकालता है, और फिर इन क्लिप के आधार पर अंतिम उत्तर उत्पन्न करता है। इस तरह, Goldfish फिल्मों या टीवी धारावाहिकों जैसे लंबे वीडियो सामग्री को कुशलता से संभाल सकता है।

image.png

इस लक्ष्य को प्राप्त करने के लिए, Goldfish टीम ने MiniGPT4-Video विकसित किया है, जो वीडियो क्लिप के लिए विस्तृत विवरण उत्पन्न करने वाला एक उपकरण है। वीडियो फ्रेम और उपशीर्षक को एक साथ मिलाकर, MiniGPT4-Video वीडियो में दृश्य और पाठ जानकारी को सटीक रूप से समझ सकता है, जिससे लंबे वीडियो को संभालने की क्षमता में वृद्धि होती है।

image.png

इसके अलावा, टीम ने TVQA-long नामक एक मानक परीक्षण प्रस्तुत किया है, जिसका उपयोग लंबे वीडियो को समझने में मॉडल की क्षमता का मूल्यांकन करने के लिए किया जाता है। Goldfish ने इस परीक्षण में 41.78% की सटीकता प्राप्त की, जो पिछले तकनीकों से आगे है।

इतना ही नहीं, Goldfish ने छोटे वीडियो समझने में भी उत्कृष्ट प्रदर्शन किया है। MSVD, MSRVTT, TGIF और TVQA जैसे कई छोटे वीडियो मानक परीक्षणों में, Goldfish का प्रदर्शन मौजूदा सबसे उन्नत तरीकों को पार कर गया, जो इसके छोटे वीडियो प्रक्रिया की शक्तिशाली क्षमता को दर्शाता है।

Goldfish ने नवोन्मेषी खोज तंत्र और कुशल विवरण उत्पन्न करने के तरीके के माध्यम से लंबे वीडियो को संभालने की चुनौती को सफलतापूर्वक पार किया, साथ ही छोटे वीडियो समझने में भी महत्वपूर्ण प्रगति की।

**मुख्य बिंदु:**

Goldfish ने कुशल खोज तंत्र और MiniGPT4-Video के विवरण उत्पन्न करने की तकनीक के माध्यम से किसी भी लंबाई के वीडियो को सफलतापूर्वक संभाला, पारंपरिक मॉडल के लिए लंबे वीडियो को संभालने में कठिनाइयों को हल किया।

TVQA-long मानक परीक्षण में, Goldfish की सटीकता 41.78% तक पहुंच गई, जो पिछले तकनीकी स्तर से आगे है, और इसकी शक्तिशाली प्रक्रिया क्षमता को प्रदर्शित करती है।

Goldfish ने कई छोटे वीडियो मानक परीक्षणों में उत्कृष्ट प्रदर्शन किया, जो मौजूदा सबसे उन्नत तरीकों को पार कर गया, और छोटे वीडियो समझने में इसकी समग्र क्षमता को साबित किया।