तेजी से विकसित हो रहे पॉडकास्ट क्षेत्र में, Podcastle प्लेटफ़ॉर्म ने हाल ही में अपने नए AI टेक्स्ट-टू-स्पीच मॉडल Asyncflow v1.0 को लॉन्च करने की घोषणा की है। यह नया मॉडल न केवल उपयोगकर्ताओं को 450 से अधिक विभिन्न AI आवाजें प्रदान करता है, बल्कि डेवलपर्स के लिए API इंटरफ़ेस भी खोलता है, ताकि वे इस टेक्स्ट-टू-स्पीच फ़ंक्शन को सीधे अपने अनुप्रयोगों में एकीकृत कर सकें।
Podcastle के संस्थापक आर्टो येरित्सियन ने कहा कि कंपनी हमेशा से एक टेक्स्ट-टू-स्पीच मॉडल विकसित करना चाहती थी, लेकिन अतीत में उच्च प्रशिक्षण लागत और डेटा की आवश्यकता के कारण, यह इच्छा पूरी नहीं हो पाई। हालाँकि, हाल के वर्षों में बड़े भाषा मॉडल तकनीक की प्रगति के साथ, Podcastle ने पिछले साल सफलता प्राप्त की, बिना अधिक डेटा के उच्च-गुणवत्ता वाले वॉयस मॉडल का निर्माण करने में सक्षम हुआ। येरित्सियन ने आगे कहा कि Podcastle के अनुसंधान और विकास को पिछले साल 1350 मिलियन अमेरिकी डॉलर के सीरीज़ A फ़ंडिंग से समर्थन मिला, जिसने इसके तकनीकी नवाचार के लिए महत्वपूर्ण सुरक्षा प्रदान की।
कीमत के मामले में, Podcastle की टेक्स्ट-टू-स्पीच सेवा की कीमत लगभग 40 अमेरिकी डॉलर प्रति 500 मिनट है, जबकि प्रतिस्पर्धी ElevenLabs 99 अमेरिकी डॉलर का शुल्क लेता है। टेक्स्ट-टू-स्पीच मॉडल के अलावा, Podcastle का वॉयस क्लोनिंग फ़ंक्शन भी अपग्रेड किया गया है, प्रशिक्षण प्रक्रिया पहले के 70 विभिन्न वाक्यों को पढ़ने की आवश्यकता से कम होकर अब केवल कुछ सेकंड की रिकॉर्डिंग तक सीमित हो गई है। नई प्रक्रिया ने Podcastle द्वारा पिछले साल लॉन्च की गई मैजिक डस्ट AI तकनीक का उपयोग किया है, जिससे ऑडियो रिकॉर्डिंग की गुणवत्ता में उल्लेखनीय सुधार हुआ है।
वास्तविक परीक्षण में, हालांकि नई उत्पन्न आवाज थोड़ी रोबोटिक लगती है, फिर भी यह वक्ता के स्वर का अच्छी तरह से अनुकरण कर सकती है। Podcastle का कहना है कि समय के साथ, यह फ़ंक्शन लगातार बेहतर होता जाएगा, और उपयोगकर्ता विभिन्न रिकॉर्डिंग नमूनों के माध्यम से विभिन्न ध्वनि प्रभावों को प्रशिक्षित भी कर सकते हैं।
येरित्सियन ने बताया कि लागत लाभ के अलावा, ऑडियो, वीडियो, पॉडकास्ट और AI-संचालित कथन उपकरणों को एक नए डिज़ाइन की गई वेबसाइट में एकीकृत करने से भी Podcastle को प्रतिस्पर्धा में अलग दिखने में मदद मिलेगी। उन्होंने उल्लेख किया कि हालांकि अधिकांश उपयोगकर्ता अभी भी मुख्य रूप से ऑडियो सामग्री निर्माण के लिए Podcastle का उपयोग करते हैं, लेकिन वीडियो निर्माण की मांग भी धीरे-धीरे बढ़ रही है।
प्रवेश द्वार:https://podcastle.ai/ai-voices
मुख्य बातें:
🌟 Podcastle ने Asyncflow v1.0 मॉडल लॉन्च किया है, जो 450 से अधिक AI आवाजें प्रदान करता है।
💰 इस प्लेटफ़ॉर्म पर 500 मिनट टेक्स्ट-टू-स्पीच की कीमत 40 अमेरिकी डॉलर है, जो प्रतिस्पर्धियों की कीमत से कम है।
🎤 वॉयस क्लोनिंग फ़ंक्शन को अपग्रेड किया गया है, प्रशिक्षण समय बहुत कम हो गया है, और उपयोगकर्ता अनुभव में लगातार सुधार हो रहा है।