9 मार्च, 2025, कैलिफ़ोर्निया, संयुक्त राज्य अमेरिका - ओपन-सोर्स मॉडल टेक्स्ट-टू-वीडियो तकनीक को और अधिक रोमांचक बना रहे हैं। AI डेवलपर Ostris (@ostrisai) ने हाल ही में X प्लेटफ़ॉर्म पर अपनी ही तस्वीरों से प्रशिक्षित Wan2.1LoRA मॉडल के परिणाम साझा किए हैं, जिसमें लगभग 20 तस्वीरों और एक घरेलू RTX4090 ग्राफ़िक्स कार्ड के साथ ही अद्भुत वीडियो जनरेशन प्रभाव प्राप्त किया गया है। इस उपलब्धि ने न केवल ओपन-सोर्स तकनीक की क्षमता को दिखाया है, बल्कि X समुदाय में वीडियो LoRA प्रशिक्षण उपकरणों पर गहन चर्चा भी शुरू की है।

image.png

Ostris का आश्चर्यजनक प्रयोग

Ostris ने 7 मार्च के X पोस्ट में पहली बार Wan2.114B LoRA के प्रशिक्षण परिणाम दिखाए थे। उन्होंने लिखा था: "Wan2.114B LoRA प्रशिक्षण 24GB पर सफलतापूर्वक चला! 4090 पर 480p रिज़ॉल्यूशन पर औसतन प्रति चरण 1.7 सेकंड।" उन्होंने एक प्रारंभिक वीडियो भी साझा किया, जिससे घरेलू हार्डवेयर पर इस मॉडल की व्यवहार्यता का प्रमाण मिला। इसके बाद 9 मार्च को, उन्होंने एक और "कम लागत वाला अवधारणा सत्यापन लघु संगीत वीडियो" जारी किया, जिसमें उन्होंने खुद के लिखे गीत और @SunoMusic द्वारा बनाया गया संगीत शामिल किया था, वीडियो में दिखाया गया डिजिटल व्यक्ति उनकी अपनी तस्वीरों से प्रशिक्षित था।

Ostris ने बताया कि उन्होंने केवल लगभग 20 व्यक्तिगत तस्वीरों का उपयोग किया था, और अपने द्वारा विकसित वीडियो LoRA प्रशिक्षण उपकरण के माध्यम से यह प्रक्रिया पूरी की थी। उन्होंने पोस्ट में कहा: "मुझे उम्मीद नहीं थी कि यह इतना अच्छा होगा! मुझे बहुत मज़ा आया।" इस प्रयोग ने न केवल Wan2.1LoRA के शक्तिशाली प्रदर्शन की पुष्टि की, बल्कि आम उपयोगकर्ताओं के लिए उच्च-गुणवत्ता वाले टेक्स्ट-टू-वीडियो को ओपन-सोर्स उपकरणों का उपयोग करके प्राप्त करने की संभावना को भी दिखाया।

प्रशिक्षण उपकरण ओपन-सोर्स साझाकरण Ostris द्वारा विकसित वीडियो LoRA प्रशिक्षण उपकरण इस रिलीज़ का एक मुख्य आकर्षण बन गया है। उपयोगकर्ता @sundyme ने 9 मार्च को पोस्ट किया: "वीडियो LoRA प्रशिक्षण आ गया है, जिससे आप AI वीडियो के नायक बन सकते हैं!" और Ostris के उपकरण का लिंक साझा किया। यह उपकरण Wan2.1 मॉडल का समर्थन करता है, जिससे उपयोगकर्ता कम तस्वीरों के साथ व्यक्तिगत वीडियो मॉडल को प्रशिक्षित कर सकते हैं, जिससे तकनीकी बाधाएँ काफी कम हो जाती हैं।

X उपयोगकर्ताओं ने इस उपकरण में गहरी रुचि दिखाई है। @sundyme ने कहा: "@ostrisai द्वारा विकसित LoRA प्रशिक्षण उपकरण, Wan2.1 का समर्थन करता है, प्रभाव आश्चर्यजनक है।" समुदाय की प्रतिक्रिया से पता चलता है कि RTX4090 जैसे उपभोक्ता-स्तरीय ग्राफ़िक्स कार्ड पर कुशल संचालन के कारण, अधिक रचनाकार घर पर AI वीडियो जनरेशन का प्रयास कर सकते हैं।

समुदाय की प्रतिक्रिया और तकनीकी महत्व

X पर प्रतिक्रियाओं से पता चलता है कि Ostris की उपलब्धि ने व्यापक उत्साह पैदा किया है। एक उपयोगकर्ता ने टिप्पणी की: "20 तस्वीरों से इतना यथार्थवादी डिजिटल व्यक्ति प्रशिक्षित करना अविश्वसनीय है!" एक अन्य उपयोगकर्ता ने ओपन-सोर्स मॉडल की क्षमता की प्रशंसा की: "टेक्स्ट-टू-वीडियो और अधिक रोमांचक होता जा रहा है, ओपन-सोर्स ने आम लोगों को भी AI को नियंत्रित करने की अनुमति दी है।"

उद्योग के विशेषज्ञों का मानना ​​है कि Ostris के प्रयोग ने वीडियो जनरेशन क्षेत्र में ओपन-सोर्स मॉडल की सफलता को उजागर किया है। Wan2.1LoRA कम-नमूना प्रशिक्षण तकनीक के साथ, न केवल हार्डवेयर की आवश्यकता कम हो गई है, बल्कि व्यक्तिगत रचना की पहुंच भी बढ़ गई है। पारंपरिक मॉडल की तुलना में, जिन्हें विशाल डेटासेट और उच्च-प्रदर्शन सर्वर की आवश्यकता होती है, यह विधि स्वतंत्र डेवलपर्स और छोटी टीमों के लिए नए रास्ते खोलती है।

परियोजना पता: https://github.com/ostris/ai-toolkit