हाल ही में, Stability AI टीम ने एक नई ओपन-सोर्स ऑडियो जनरेशन मॉडल लॉन्च की है, जिसका नाम Stable Audio Open है। इस मॉडल की खासियत यह है कि यह टेक्स्ट प्रॉम्प्ट से 47 सेकंड तक की स्टेरियो ऑडियो जनरेट कर सकता है, जिसकी सैंपलिंग दर 44.1kHz तक है।
उत्पाद का लिंक:https://top.aibase.com/tool/stable-audio-open-demo
विभिन्न वर्तमान लोकप्रिय ऑडियो जनरेशन मॉडलों के विपरीत, Stable Audio Open के वेट्स खुले हैं, जिसका मतलब है कि कोई भी इस मॉडल को देख सकता है, संशोधित कर सकता है और विस्तारित कर सकता है। इस प्रकार की डिज़ाइन सोच न केवल वैज्ञानिक अनुसंधान की प्रगति को बढ़ावा देती है, बल्कि डेवलपर्स को और अधिक संभावनाएं प्रदान करती है। सबसे महत्वपूर्ण बात यह है कि इस मॉडल को केवल क्रिएटिव कॉमन्स लाइसेंस प्राप्त ऑडियो फ़ाइलों का उपयोग करके प्रशिक्षित किया गया है, जिससे डेटा की वैधता सुनिश्चित होती है और संभावित कॉपीराइट मुद्दों से बचा जाता है, जो नैतिक डेटा उपयोग के प्रति उच्च प्राथमिकता को दर्शाता है।
तकनीकी आर्किटेक्चर के मामले में, Stable Audio Open ने उन्नत आर्किटेक्चर का उपयोग किया है, जो टेक्स्ट से ऑडियो जनरेशन की उच्च विश्वसनीयता सुनिश्चित करता है। यह उच्च गुणवत्ता वाली स्टेरियो ऑडियो जनरेट कर सकता है, जिससे उपयोगकर्ताओं को स्पष्ट और वास्तविक ध्वनि अनुभव का आनंद मिलता है। प्रशिक्षण के दौरान, मॉडल ने विभिन्न प्रकार के ऑडियो सैंपल से संपर्क किया, जिससे यह अधिक समृद्ध ध्वनि परिदृश्य सीखने में मदद मिली, जिससे जनरेट की गई ऑडियो और अधिक वास्तविक और विविध हो गई।
इसके अलावा, नए मॉडल के प्रदर्शन को उद्योग के शीर्ष मॉडलों के साथ तुलना करने के लिए, विकास टीम ने व्यापक प्रदर्शन मूल्यांकन किया। FDopenl3 जैसे प्रमुख मूल्यांकन मानक के माध्यम से, शोधकर्ताओं ने पाया कि इस मॉडल ने उच्च गुणवत्ता वाली ऑडियो जनरेशन में अच्छा प्रदर्शन किया, जो उद्योग के अन्य उत्कृष्ट मॉडलों के समान है। यह तुलना अध्ययन Stable Audio Open की श्रेष्ठता और व्यावहारिकता को और प्रमाणित करता है।
Stable Audio Open का लॉन्च न केवल खुलापन और उच्च गुणवत्ता वाली ऑडियो संश्लेषण पर ध्यान केंद्रित करता है, बल्कि शोधकर्ताओं, कलाकारों और डेवलपर्स के लिए एक महत्वपूर्ण उपकरण भी प्रदान करता है।
मुख्य बिंदु:
- 🎧 Stability AI ने Stable Audio Open लॉन्च किया, जो लंबाई (अधिकतम 47 सेकंड) और 44.1kHz स्टेरियो ऑडियो जनरेट करने का समर्थन करता है।
- 📝 इस मॉडल ने केवल क्रिएटिव कॉमन्स लाइसेंस प्राप्त ऑडियो डेटा का उपयोग करके प्रशिक्षण लिया है, जिससे डेटा की वैधता और नैतिकता सुनिश्चित होती है।
- 🔍 उद्योग के शीर्ष मॉडलों की तुलना में, Stable Audio Open की ऑडियो जनरेशन गुणवत्ता को सत्यापित किया गया है, जिसमें उच्च विश्वसनीयता और विविधता है।