Stability AI अपने Stable Diffusion टेक्स्ट-टू-इमेज मॉडल के लिए जाना जाता है। हाल ही में, इस कंपनी ने वैश्विक सेमीकंडक्टर दिग्गज Arm के साथ साझेदारी की है ताकि मोबाइल उपकरणों पर ऑडियो जनरेट करने वाली AI क्षमताओं को लाया जा सके। इस सहयोग से Stable Audio Open मॉडल Arm CPU पर पूरी तरह से चल सकता है, जिससे उपयोगकर्ता बिना इंटरनेट कनेक्शन के ही डिवाइस पर तेज़ी से ध्वनि प्रभाव, ऑडियो नमूने और निर्माण तत्व बना सकते हैं।
Stability AI का कहना है कि जैसे-जैसे जनरेटिव AI का उपयोग व्यवसायों और पेशेवर क्रिएटर्स में बढ़ रहा है, यह सुनिश्चित करना ज़रूरी है कि हमारे मॉडल और कार्यप्रवाह सभी क्रिएटिव क्षेत्रों में आसानी से उपलब्ध हों। इससे न केवल निर्माण की दक्षता बढ़ेगी बल्कि दृश्य मीडिया निर्माण प्रक्रिया में इन तकनीकों को एकीकृत करने में भी मदद मिलेगी।
बढ़ती मांग को पूरा करने के लिए, कंपनी का लक्ष्य अपने मॉडल को एज डिवाइस पर अधिक कुशल बनाना है। मोबाइल उपकरणों के लिए Stable Audio Open मॉडल के अनुकूलन के दौरान, शुरुआती परीक्षणों में एक Arm CPU डिवाइस पर ऑडियो जनरेट करने में 240 सेकंड का समय लगा। मॉडल के आसवन और Arm के सॉफ्टवेयर स्टैक, विशेष रूप से XNNPack के KleidiAI में int8 मैट्रिक्स गुणन कर्नेल के उपयोग से, कंपनी ने 11 सेकंड के ऑडियो क्लिप को जनरेट करने का समय घटाकर 8 सेकंड कर दिया है, जिससे 30 गुना तेज़ी आई है।
ध्यान दें कि इस सुविधा का अनुभव करने के लिए उपयोगकर्ताओं के पास संगत मोबाइल डिवाइस होना चाहिए। चूँकि अधिकांश स्मार्टफोन में Arm आर्किटेक्चर वाला CPU होता है, इसलिए यह तकनीक विभिन्न प्रकार के उपयोगकर्ताओं के लिए सुलभ हो जाती है। भविष्य में, Stability AI का लक्ष्य अपने सभी मॉडल, जिसमें इमेज, वीडियो और 3D शामिल हैं, को एज डिवाइस पर लाना है ताकि मोबाइल उपकरणों पर दृश्य मीडिया निर्माण के तरीके में क्रांति लाया जा सके।
मुख्य बातें:
🌟 Stability AI ने Arm के साथ मिलकर मोबाइल उपकरणों पर ऑफ़लाइन ऑडियो जनरेट करने की तकनीक लॉन्च की है।
⚡ मॉडल आसवन और सॉफ्टवेयर अनुकूलन के माध्यम से, ऑडियो जनरेट करने का समय 240 सेकंड से घटकर 8 सेकंड हो गया है, जिससे 30 गुना वृद्धि हुई है।
📱 यह तकनीक अधिकांश Arm CPU वाले स्मार्टफोन पर काम करती है और भविष्य में इसे और अधिक मीडिया निर्माण क्षेत्रों में विस्तारित किया जाएगा।