हाल ही में, हांगकांग विश्वविद्यालय और बाइटडांस ने मिलकर एक गतिशील वीडियो जनरेशन मॉडल Goku का विकास किया है, जिसे आधिकारिक रूप से जारी किया गया है। यह मॉडल उन्नत जनरेटिव एल्गोरिदम का उपयोग करता है, जो टेक्स्ट प्रॉम्प्ट के आधार पर उच्च गुणवत्ता वाले वीडियो सामग्री उत्पन्न कर सकता है, जिससे डिजिटल कला के प्रदर्शन रूपों में बहुत अधिक विविधता आई है।
Goku मॉडल की शक्तिशाली क्षमताओं को प्रदर्शित करने के लिए, शोध टीम ने एक श्रृंखला शानदार वीडियो उदाहरण बनाए हैं, जो न केवल मॉडल की तकनीकी क्षमताओं को दर्शाते हैं, बल्कि इसके रचनात्मक प्रदर्शन में अनंत संभावनाओं को भी उजागर करते हैं।
Goku मॉडल की विशेषता इसकी उच्च उत्पादन गति और छवि गुणवत्ता है। बड़े पैमाने पर डेटा प्रशिक्षण के माध्यम से, Goku एनिमेशन, प्राकृतिक दृश्य, पशु व्यवहार आदि जैसे कई दृश्य उत्पन्न कर सकता है। शोधकर्ताओं ने परीक्षण के लिए मूल MovieGenBench प्रॉम्प्ट का उपयोग किया, जिससे प्रदर्शन के प्रभाव में स्थिरता और निष्पक्षता सुनिश्चित हुई।
उदाहरण के लिए, एक वीडियो में एक फैशनेबल महिला को टोक्यो की सड़कों पर आत्मविश्वास से चलते हुए दिखाया गया है, जहां रंग-बिरंगी नीयन लाइटें गर्म रात के माहौल को उभारती हैं, और भीड़ भरी सड़कों का दृश्य जीवंत और वास्तविक है।
एक अन्य वीडियो में, कई विशाल मैमथ बर्फ में आराम से चलते हुए दिखाए गए हैं, और चारों ओर बर्फीले पहाड़ और जंगल इस दृश्य को एक बर्फीले संसार में ले जाते हैं। ये जीवंत दृश्य न केवल दर्शकों का ध्यान आकर्षित करते हैं, बल्कि कला निर्माताओं को भी समृद्ध प्रेरणा प्रदान करते हैं।
और भी आश्चर्यजनक बात यह है कि Goku सीधे वर्चुअल डिजिटल मानव वीडियो उत्पन्न करने का समर्थन करता है। Goku+ टेक्स्ट को超现实 मानव वीडियो में बदल देता है, जो मौजूदा तरीकों से स्पष्ट रूप से बेहतर है। विशेष रूप से, यह 20 सेकंड से अधिक के वीडियो उत्पन्न कर सकता है, जिसमें स्थिर हाथों की हरकतें और मानव प्रतिभागियों के अत्यधिक अभिव्यक्तिपूर्ण चेहरे और शरीर की हरकतें शामिल हैं।
इसके अलावा, यह उत्पाद चित्रों से इंटरैक्टिव वीडियो उत्पन्न करने का समर्थन करता है, उत्पाद शैली बनाए रखते हुए और उत्पाद प्रदर्शन वीडियो उत्पन्न करने की क्षमता रखता है, साथ ही टेक्स्ट से विज्ञापन वीडियो भी उत्पन्न कर सकता है।
नीचे चित्र: Goku+ उत्पाद चित्रों को आकर्षक वीडियो क्लिप में परिवर्तित करता है, जो एंड-टू-एंड ऑप्टिमाइजेशन सुनिश्चित करता है। यह प्रक्रिया आपके मार्केटिंग सामग्री की आकर्षण और प्रभावशीलता को बढ़ाती है।
नीचे चित्र: विशिष्ट उत्पादों को प्रदर्शित करने के लिए वास्तविक और आकर्षक वीडियो बनाना। ये वीडियो उत्पाद की आत्मा को प्रभावी ढंग से पकड़ते हैं, दर्शकों की भागीदारी और रुचि को बढ़ाते हैं।
इसके अलावा, मॉडल टेक्स्ट से कस्टम हाई-डेफिनिशन वीडियो बनाने का समर्थन करता है, जिससे विज्ञापन दृश्यों को अनुकूलित किया जा सके, जो प्रतियोगियों के वीडियो बेस मॉडल से स्पष्ट रूप से बेहतर है।
प्रोजेक्ट का लिंक: https://saiyan-world.github.io/goku/
मुख्य बिंदु:
🌟 Goku मॉडल हांगकांग विश्वविद्यालय और बाइटडांस द्वारा विकसित किया गया है, जो टेक्स्ट प्रॉम्प्ट के आधार पर उच्च गुणवत्ता वाले वीडियो सामग्री उत्पन्न कर सकता है।
🎨 मॉडल ने कई दृश्य प्रस्तुत किए हैं, जिनमें फैशनेबल महिलाएं टोक्यो की सड़कों पर चलती हैं और विशाल मैमथ बर्फ में चलते हैं, जो जीवंत और वास्तविक प्रभाव डालते हैं।
💡 Goku मॉडल की रिलीज़ ने दृश्य कला निर्माण के लिए नए उपकरण प्रदान किए हैं, जो निर्माताओं को अधिक संभावनाओं का अन्वेषण करने में मदद करते हैं।