हाल ही में, AI वीडियो कंपनी Genmo ने Mochi1 लॉन्च करने की घोषणा की, जो एक नया ओपन-सोर्स वीडियो जनरेशन मॉडल है, जिसके जरिए उपयोगकर्ता टेक्स्ट प्रॉम्प्ट के माध्यम से उच्च गुणवत्ता वाले वीडियो उत्पन्न कर सकते हैं। Mochi1 का प्रदर्शन वर्तमान में बाजार में मौजूद प्रमुख क्लोज़-सोर्स प्रतिस्पर्धियों जैसे Runway, Luma AI के Dream Machine, Kuaishou के 可灵, Minimax के Hailuo आदि के साथ प्रतिस्पर्धा करने योग्य माना जाता है, बल्कि इससे बेहतर भी है।

image.png

यह मॉडल Apache 2.0 लाइसेंस के तहत ओपन किया गया है, जिससे उपयोगकर्ता बिना किसी शुल्क के अत्याधुनिक वीडियो जनरेशन तकनीक का लाभ उठा सकते हैं, जबकि अन्य प्रतिस्पर्धी उत्पादों के शुल्क मानक सीमित मुफ्त योजनाओं से लेकर प्रति माह 94.99 डॉलर तक हैं।

उपयोगकर्ता Hugging Face पर Mochi1 के मॉडल वेट और कोड को मुफ्त में डाउनलोड कर सकते हैं, लेकिन इस मॉडल को अपने व्यक्तिगत उपकरणों पर चलाने के लिए कम से कम चार Nvidia H100 GPU की आवश्यकता होती है। उपयोगकर्ताओं को Mochi1 की सुविधाओं का अनुभव कराने के लिए, Genmo ने एक ऑनलाइन डेमो प्लेटफॉर्म भी प्रदान किया है, जिससे सभी लोग इस नई तकनीक का अनुभव कर सकें।

Mochi1 द्वारा उत्पन्न वीडियो प्रभाव के उदाहरण:

Genmo के अनुसार, Mochi1 विस्तृत उपयोगकर्ता निर्देशों का पालन करने में माहिर है, जो उत्पन्न वीडियो में पात्रों, सेटिंग्स और क्रियाओं पर सटीक नियंत्रण की अनुमति देता है। Genmo ने दावा किया है कि आंतरिक परीक्षणों में, Mochi1 ने तेजी से चिपकने और गति की गुणवत्ता के मामले में अधिकांश अन्य वीडियो AI मॉडलों को पीछे छोड़ दिया है, जिसमें मालिकाना प्रतिस्पर्धी Runway और Luna भी शामिल हैं।

image.png

image.png

Mochi1 ने वीडियो जनरेशन के क्षेत्र में महत्वपूर्ण प्रगति की है, जिसमें उच्च फिडेलिटी मूवमेंट प्रदर्शन और सटीक प्रॉम्प्ट पालन क्षमता शामिल है। Genmo के CEO Paras Jain ने कहा कि उनका लक्ष्य ओपन-सोर्स और क्लोज़-सोर्स वीडियो जनरेशन मॉडल के बीच के अंतर को कम करना है। उन्होंने जोर दिया कि वीडियो सबसे महत्वपूर्ण संचार रूप है, इसलिए वे इस तकनीक को अधिक से अधिक लोगों तक पहुँचाना चाहते हैं।

इस बीच, Genmo ने 2840 मिलियन डॉलर की सीरीज A फंडिंग पूरी करने की भी घोषणा की, जिसमें NEA और कई वेंचर कैपिटल फर्म शामिल हैं। Jain ने कहा कि वीडियो जनरेशन केवल मनोरंजन या सामग्री निर्माण नहीं है, बल्कि भविष्य के रोबोट और स्वायत्त प्रणालियों के लिए एक महत्वपूर्ण उपकरण है।

Mochi1 का आर्किटेक्चर Genmo के अनूठे असममित डिफ्यूजन ट्रांसफार्मर (AsymmDiT) पर आधारित है, जो अब तक का सबसे बड़ा ओपन-सोर्स वीडियो जनरेशन मॉडल है, जिसमें 10 बिलियन पैरामीटर हैं। यह मॉडल दृश्य तर्क पर केंद्रित है, जिससे यह वीडियो डेटा को संभालने में अधिक कुशल बनता है।

Mochi1 द्वारा उत्पन्न वीडियो प्रभाव के उदाहरण:

हालांकि Mochi1 ने शक्तिशाली क्षमताएँ प्रदर्शित की हैं, लेकिन वर्तमान में कुछ सीमाएँ भी हैं, जैसे कि वर्तमान में समर्थित रिज़ॉल्यूशन 480p है, और जटिल मूवमेंट सीन में हल्का दृश्य विकृति हो सकता है। Genmo इस वर्ष के अंत तक 720p रिज़ॉल्यूशन का समर्थन करने वाला Mochi1HD संस्करण लॉन्च करने की योजना बना रहा है, ताकि उपयोगकर्ता अनुभव को बेहतर बनाया जा सके।

डेमो लिंक:https://www.genmo.ai/play

मॉडल डाउनलोड: https://huggingface.co/genmo/mochi-1-preview

मुख्य बातें:

🌟 Mochi1 Genmo द्वारा पेश किया गया ओपन-सोर्स वीडियो जनरेशन मॉडल है, जिसका उपयोग उपयोगकर्ता मुफ्त में कर सकते हैं, और यह कई क्लोज़-सोर्स उत्पादों के साथ प्रतिस्पर्धा करता है।

💰 Genmo ने 2840 मिलियन डॉलर की सीरीज A फंडिंग पूरी की, जिसका उद्देश्य AI वीडियो तकनीक का लोकतंत्रीकरण करना है।

🎥 भविष्य में Mochi1HD संस्करण लॉन्च किया जाएगा, जो वर्तमान 480p रिज़ॉल्यूशन और जटिल मूवमेंट सीन में कुछ सीमाओं को हल करेगा।