हाल ही में, हांगकांग विश्वविद्यालय और बाइटडांस ने मिलकर एक गतिशील वीडियो जनरेशन मॉडल Goku का विकास किया है, जिसे आधिकारिक रूप से जारी किया गया है। यह मॉडल उन्नत जनरेटिव एल्गोरिदम का उपयोग करता है, जो टेक्स्ट प्रॉम्प्ट के आधार पर उच्च गुणवत्ता वाले वीडियो सामग्री उत्पन्न कर सकता है, जिससे डिजिटल कला के प्रदर्शन रूपों में बहुत अधिक विविधता आई है।

Goku मॉडल की शक्तिशाली क्षमताओं को प्रदर्शित करने के लिए, शोध टीम ने एक श्रृंखला शानदार वीडियो उदाहरण बनाए हैं, जो न केवल मॉडल की तकनीकी क्षमताओं को दर्शाते हैं, बल्कि इसके रचनात्मक प्रदर्शन में अनंत संभावनाओं को भी उजागर करते हैं।

Goku मॉडल की विशेषता इसकी उच्च उत्पादन गति और छवि गुणवत्ता है। बड़े पैमाने पर डेटा प्रशिक्षण के माध्यम से, Goku एनिमेशन, प्राकृतिक दृश्य, पशु व्यवहार आदि जैसे कई दृश्य उत्पन्न कर सकता है। शोधकर्ताओं ने परीक्षण के लिए मूल MovieGenBench प्रॉम्प्ट का उपयोग किया, जिससे प्रदर्शन के प्रभाव में स्थिरता और निष्पक्षता सुनिश्चित हुई।

उदाहरण के लिए, एक वीडियो में एक फैशनेबल महिला को टोक्यो की सड़कों पर आत्मविश्वास से चलते हुए दिखाया गया है, जहां रंग-बिरंगी नीयन लाइटें गर्म रात के माहौल को उभारती हैं, और भीड़ भरी सड़कों का दृश्य जीवंत और वास्तविक है।

एक अन्य वीडियो में, कई विशाल मैमथ बर्फ में आराम से चलते हुए दिखाए गए हैं, और चारों ओर बर्फीले पहाड़ और जंगल इस दृश्य को एक बर्फीले संसार में ले जाते हैं। ये जीवंत दृश्य न केवल दर्शकों का ध्यान आकर्षित करते हैं, बल्कि कला निर्माताओं को भी समृद्ध प्रेरणा प्रदान करते हैं।

और भी आश्चर्यजनक बात यह है कि Goku सीधे वर्चुअल डिजिटल मानव वीडियो उत्पन्न करने का समर्थन करता है। Goku+ टेक्स्ट को超现实 मानव वीडियो में बदल देता है, जो मौजूदा तरीकों से स्पष्ट रूप से बेहतर है। विशेष रूप से, यह 20 सेकंड से अधिक के वीडियो उत्पन्न कर सकता है, जिसमें स्थिर हाथों की हरकतें और मानव प्रतिभागियों के अत्यधिक अभिव्यक्तिपूर्ण चेहरे और शरीर की हरकतें शामिल हैं।

image.png

इसके अलावा, यह उत्पाद चित्रों से इंटरैक्टिव वीडियो उत्पन्न करने का समर्थन करता है, उत्पाद शैली बनाए रखते हुए और उत्पाद प्रदर्शन वीडियो उत्पन्न करने की क्षमता रखता है, साथ ही टेक्स्ट से विज्ञापन वीडियो भी उत्पन्न कर सकता है।

नीचे चित्र: Goku+ उत्पाद चित्रों को आकर्षक वीडियो क्लिप में परिवर्तित करता है, जो एंड-टू-एंड ऑप्टिमाइजेशन सुनिश्चित करता है। यह प्रक्रिया आपके मार्केटिंग सामग्री की आकर्षण और प्रभावशीलता को बढ़ाती है।

image.png

नीचे चित्र: विशिष्ट उत्पादों को प्रदर्शित करने के लिए वास्तविक और आकर्षक वीडियो बनाना। ये वीडियो उत्पाद की आत्मा को प्रभावी ढंग से पकड़ते हैं, दर्शकों की भागीदारी और रुचि को बढ़ाते हैं।

image.png

इसके अलावा, मॉडल टेक्स्ट से कस्टम हाई-डेफिनिशन वीडियो बनाने का समर्थन करता है, जिससे विज्ञापन दृश्यों को अनुकूलित किया जा सके, जो प्रतियोगियों के वीडियो बेस मॉडल से स्पष्ट रूप से बेहतर है।

image.png

प्रोजेक्ट का लिंक: https://saiyan-world.github.io/goku/

मुख्य बिंदु:

🌟 Goku मॉडल हांगकांग विश्वविद्यालय और बाइटडांस द्वारा विकसित किया गया है, जो टेक्स्ट प्रॉम्प्ट के आधार पर उच्च गुणवत्ता वाले वीडियो सामग्री उत्पन्न कर सकता है।  

🎨 मॉडल ने कई दृश्य प्रस्तुत किए हैं, जिनमें फैशनेबल महिलाएं टोक्यो की सड़कों पर चलती हैं और विशाल मैमथ बर्फ में चलते हैं, जो जीवंत और वास्तविक प्रभाव डालते हैं।  

💡 Goku मॉडल की रिलीज़ ने दृश्य कला निर्माण के लिए नए उपकरण प्रदान किए हैं, जो निर्माताओं को अधिक संभावनाओं का अन्वेषण करने में मदद करते हैं।