हाल ही में, AI वीडियो कंपनी Genmo ने Mochi1 लॉन्च करने की घोषणा की, जो एक नया ओपन-सोर्स वीडियो जनरेशन मॉडल है, जिसके जरिए उपयोगकर्ता टेक्स्ट प्रॉम्प्ट के माध्यम से उच्च गुणवत्ता वाले वीडियो उत्पन्न कर सकते हैं। Mochi1 का प्रदर्शन वर्तमान में बाजार में मौजूद प्रमुख क्लोज़-सोर्स प्रतिस्पर्धियों जैसे Runway, Luma AI के Dream Machine, Kuaishou के 可灵, Minimax के Hailuo आदि के साथ प्रतिस्पर्धा करने योग्य माना जाता है, बल्कि इससे बेहतर भी है।
यह मॉडल Apache 2.0 लाइसेंस के तहत ओपन किया गया है, जिससे उपयोगकर्ता बिना किसी शुल्क के अत्याधुनिक वीडियो जनरेशन तकनीक का लाभ उठा सकते हैं, जबकि अन्य प्रतिस्पर्धी उत्पादों के शुल्क मानक सीमित मुफ्त योजनाओं से लेकर प्रति माह 94.99 डॉलर तक हैं।
उपयोगकर्ता Hugging Face पर Mochi1 के मॉडल वेट और कोड को मुफ्त में डाउनलोड कर सकते हैं, लेकिन इस मॉडल को अपने व्यक्तिगत उपकरणों पर चलाने के लिए कम से कम चार Nvidia H100 GPU की आवश्यकता होती है। उपयोगकर्ताओं को Mochi1 की सुविधाओं का अनुभव कराने के लिए, Genmo ने एक ऑनलाइन डेमो प्लेटफॉर्म भी प्रदान किया है, जिससे सभी लोग इस नई तकनीक का अनुभव कर सकें।
Mochi1 द्वारा उत्पन्न वीडियो प्रभाव के उदाहरण:
Genmo के अनुसार, Mochi1 विस्तृत उपयोगकर्ता निर्देशों का पालन करने में माहिर है, जो उत्पन्न वीडियो में पात्रों, सेटिंग्स और क्रियाओं पर सटीक नियंत्रण की अनुमति देता है। Genmo ने दावा किया है कि आंतरिक परीक्षणों में, Mochi1 ने तेजी से चिपकने और गति की गुणवत्ता के मामले में अधिकांश अन्य वीडियो AI मॉडलों को पीछे छोड़ दिया है, जिसमें मालिकाना प्रतिस्पर्धी Runway और Luna भी शामिल हैं।
Mochi1 ने वीडियो जनरेशन के क्षेत्र में महत्वपूर्ण प्रगति की है, जिसमें उच्च फिडेलिटी मूवमेंट प्रदर्शन और सटीक प्रॉम्प्ट पालन क्षमता शामिल है। Genmo के CEO Paras Jain ने कहा कि उनका लक्ष्य ओपन-सोर्स और क्लोज़-सोर्स वीडियो जनरेशन मॉडल के बीच के अंतर को कम करना है। उन्होंने जोर दिया कि वीडियो सबसे महत्वपूर्ण संचार रूप है, इसलिए वे इस तकनीक को अधिक से अधिक लोगों तक पहुँचाना चाहते हैं।
इस बीच, Genmo ने 2840 मिलियन डॉलर की सीरीज A फंडिंग पूरी करने की भी घोषणा की, जिसमें NEA और कई वेंचर कैपिटल फर्म शामिल हैं। Jain ने कहा कि वीडियो जनरेशन केवल मनोरंजन या सामग्री निर्माण नहीं है, बल्कि भविष्य के रोबोट और स्वायत्त प्रणालियों के लिए एक महत्वपूर्ण उपकरण है।
Mochi1 का आर्किटेक्चर Genmo के अनूठे असममित डिफ्यूजन ट्रांसफार्मर (AsymmDiT) पर आधारित है, जो अब तक का सबसे बड़ा ओपन-सोर्स वीडियो जनरेशन मॉडल है, जिसमें 10 बिलियन पैरामीटर हैं। यह मॉडल दृश्य तर्क पर केंद्रित है, जिससे यह वीडियो डेटा को संभालने में अधिक कुशल बनता है।
Mochi1 द्वारा उत्पन्न वीडियो प्रभाव के उदाहरण:
हालांकि Mochi1 ने शक्तिशाली क्षमताएँ प्रदर्शित की हैं, लेकिन वर्तमान में कुछ सीमाएँ भी हैं, जैसे कि वर्तमान में समर्थित रिज़ॉल्यूशन 480p है, और जटिल मूवमेंट सीन में हल्का दृश्य विकृति हो सकता है। Genmo इस वर्ष के अंत तक 720p रिज़ॉल्यूशन का समर्थन करने वाला Mochi1HD संस्करण लॉन्च करने की योजना बना रहा है, ताकि उपयोगकर्ता अनुभव को बेहतर बनाया जा सके।
डेमो लिंक:https://www.genmo.ai/play
मॉडल डाउनलोड: https://huggingface.co/genmo/mochi-1-preview
मुख्य बातें:
🌟 Mochi1 Genmo द्वारा पेश किया गया ओपन-सोर्स वीडियो जनरेशन मॉडल है, जिसका उपयोग उपयोगकर्ता मुफ्त में कर सकते हैं, और यह कई क्लोज़-सोर्स उत्पादों के साथ प्रतिस्पर्धा करता है।
💰 Genmo ने 2840 मिलियन डॉलर की सीरीज A फंडिंग पूरी की, जिसका उद्देश्य AI वीडियो तकनीक का लोकतंत्रीकरण करना है।
🎥 भविष्य में Mochi1HD संस्करण लॉन्च किया जाएगा, जो वर्तमान 480p रिज़ॉल्यूशन और जटिल मूवमेंट सीन में कुछ सीमाओं को हल करेगा।