हाल ही में, DeepBeepMeep टीम ने GitHub पर Wan2.1GP जारी किया है, जो कि निम्न-स्तरीय GPU उपयोगकर्ताओं के लिए अनुकूलित एक वीडियो निर्माण मॉडल है। यह मॉडल अलीबाबा के Wan2.1 पर आधारित है, जिसका उद्देश्य उच्च-प्रदर्शन GPU संसाधनों की कमी वाले उपयोगकर्ताओं को शक्तिशाली वीडियो निर्माण क्षमता प्रदान करना है। Wan2.1GP का प्रक्षेपण वीडियो निर्माण तकनीक की एक महत्वपूर्ण प्रगति का प्रतीक है, खासकर ओपन सोर्स क्षेत्र में।

रोबोट ऑफिस में टाइपिंग करता हुआ 1

चित्र स्रोत टिप्पणी: यह चित्र AI द्वारा बनाया गया है, चित्र अधिकार सेवा प्रदाता Midjourney

Wan2.1GP की मुख्य विशेषताओं में इसका उत्कृष्ट प्रदर्शन और व्यापक अनुप्रयोग शामिल हैं। इस मॉडल ने कई बेंचमार्क परीक्षणों में मौजूदा ओपन सोर्स मॉडल और कुछ व्यावसायिक समाधानों को लगातार पीछे छोड़ा है, जो इसकी शक्तिशाली प्रतिस्पर्धा को दर्शाता है। इसके अलावा, T2V-1.3B मॉडल को केवल 8.19GB VRAM की आवश्यकता होती है, जिससे लगभग सभी उपभोक्ता-स्तरीय GPU इसे चला सकते हैं। एक RTX4090 ग्राफिक्स कार्ड के माध्यम से, उपयोगकर्ता लगभग 4 मिनट में 5 सेकंड का 480P वीडियो बना सकते हैं, जिसका प्रदर्शन कुछ बंद स्रोत मॉडल के बराबर है।

Wan2.1GP न केवल टेक्स्ट-टू-वीडियो, इमेज-टू-वीडियो, वीडियो संपादन आदि जैसे कई कार्यों का समर्थन करता है, बल्कि यह पहला मॉडल भी है जो एक साथ चीनी और अंग्रेजी पाठ वाले वीडियो उत्पन्न कर सकता है। यह विशेषता उपयोगकर्ताओं के व्यावहारिक अनुप्रयोगों के लिए अधिक संभावनाएँ लाती है। इसके अलावा, इस मॉडल में एक शक्तिशाली वीडियो वैरिएशनल ऑटोएन्कोडर (VAE) भी है, जो किसी भी लंबाई के 1080P वीडियो को कुशलतापूर्वक एन्कोड और डिकोड कर सकता है, समय की जानकारी को अच्छी तरह से संरक्षित रखता है, और वीडियो और छवि निर्माण के लिए एक ठोस आधार प्रदान करता है।

उपयोगकर्ता अनुभव को बेहतर बनाने के लिए, Wan2.1GP को कई तरह से अनुकूलित किया गया है, जिसमें मेमोरी और VRAM की आवश्यकता में उल्लेखनीय कमी, विभिन्न प्रदर्शन वाले उपकरणों के अनुकूल विभिन्न कॉन्फ़िगरेशन का समर्थन शामिल है। उपयोगकर्ता एक सरलीकृत स्थापना प्रक्रिया के माध्यम से इस उपकरण का तेज़ी से उपयोग शुरू कर सकते हैं। निरंतर संस्करण अपडेट के साथ, Wan2.1GP में धीरे-धीरे और अधिक व्यावहारिक कार्य भी जोड़े गए हैं, जैसे कि Tea Cache समर्थन, Gradio इंटरफ़ेस में सुधार आदि, जिससे निर्माण की गति और उपयोग की सुविधा में और वृद्धि हुई है।

परियोजना प्रवेश द्वार:https://github.com/deepbeepmeep/Wan2GP

मुख्य बिंदु:

👍 SOTA प्रदर्शन: Wan2.1GP ने कई बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन किया है, मौजूदा ओपन सोर्स और व्यावसायिक समाधानों को पार कर गया है।

🖥️ मजबूत संगतता: केवल 8.19GB VRAM की आवश्यकता है, लगभग सभी उपभोक्ता-स्तरीय GPU का समर्थन करता है, निम्न-स्तरीय उपयोगकर्ताओं के लिए उपयुक्त है।

📜 बहु-कार्य समर्थन: टेक्स्ट-टू-वीडियो, इमेज-टू-वीडियो और अन्य कई निर्माण कार्यों का समर्थन करता है, और चीनी और अंग्रेजी पाठ निर्माण क्षमता रखता है।