Llasa-1B

Llasa-1B एक LLaMA-आधारित टेक्स्ट-टू-स्पीच (TTS) मॉडल है जो चीनी और अंग्रेजी भाषाओं में भाषण संश्लेषण का समर्थन करता है।

सामान्य उत्पादअन्यटेक्स्ट-टू-स्पीचवॉयस संश्लेषण
Llasa-1B हांगकांग विज्ञान और प्रौद्योगिकी विश्वविद्यालय की ऑडियो प्रयोगशाला द्वारा विकसित एक टेक्स्ट-टू-स्पीच मॉडल है। यह LLaMA आर्किटेक्चर पर आधारित है और XCodec2 कोडबुक में वॉयस मार्किंग को जोड़कर, टेक्स्ट को प्राकृतिक और सुचारू वॉयस में बदल सकता है। यह मॉडल 250,000 घंटे के चीनी और अंग्रेजी भाषा के वॉयस डेटा पर प्रशिक्षित किया गया है, और यह सादे टेक्स्ट से वॉयस जेनरेट कर सकता है, साथ ही दिए गए वॉयस प्रॉम्प्ट का उपयोग करके भी संश्लेषण कर सकता है। इसका मुख्य लाभ उच्च-गुणवत्ता वाली बहुभाषी वॉयस जेनरेट करना है, जो ऑडियोबुक, वॉयस असिस्टेंट आदि जैसे कई भाषण संश्लेषण परिदृश्यों के लिए उपयुक्त है। यह मॉडल CC BY-NC-ND 4.0 लाइसेंस के अंतर्गत है, और वाणिज्यिक उपयोग के लिए निषिद्ध है।
वेबसाइट खोलें

Llasa-1B नवीनतम ट्रैफ़िक स्थिति

मासिक कुल विज़िट

29742941

बाउंस दर

44.20%

प्रति विज़िट औसत पृष्ठ

5.9

औसत विज़िट अवधि

00:04:44

Llasa-1B विज़िट प्रवृत्ति

Llasa-1B विज़िट भौगोलिक वितरण

Llasa-1B ट्रैफ़िक स्रोत

Llasa-1B विकल्प