बैलिंग-TTS
उच्च-गुणवत्ता वाली चीनी बोलियों के भाषण के लिए एक बड़ा पैमाने का टेक्स्ट-टू-स्पीच मॉडल।
सामान्य उत्पादअन्यटेक्स्ट-टू-स्पीचबोलियाँ
बैलिंग-TTS जायंट नेटवर्क के AI लैब द्वारा विकसित एक बड़ा टेक्स्ट-टू-स्पीच (TTS) मॉडल श्रृंखला है, जो उच्च-गुणवत्ता वाली चीनी बोलियों के भाषण को उत्पन्न करने पर केंद्रित है। यह मॉडल निरंतर अर्ध-पर्यवेक्षित शिक्षा और एक विशिष्ट ट्रांसफॉर्मर आर्किटेक्चर का उपयोग करता है, एक बहु-चरणीय प्रशिक्षण प्रक्रिया के माध्यम से, पाठ और भाषण टोकनों को प्रभावी ढंग से संरेखित करता है, जिससे उच्च-गुणवत्ता वाली चीनी बोलियों का भाषण संश्लेषण संभव होता है। प्रयोगों में, बैलिंग-TTS ने मानव-जैसी प्राकृतिक भाषण संश्लेषण प्रभाव दिखाया है, जो बोलियों के भाषण संश्लेषण के क्षेत्र के लिए महत्वपूर्ण है।