FunAudioLLM

प्राकृतिक अंतःक्रिया वाले ध्वनि समझ और निर्माण के आधार मॉडल

सामान्य उत्पादअन्यध्वनि पहचानध्वनि संश्लेषण
FunAudioLLM एक ऐसा ढाँचा है जिसका उद्देश्य बड़े भाषा मॉडल (Large Language Models, LLMs) के साथ मानवों के बीच प्राकृतिक ध्वनि अंतःक्रिया को बढ़ाना है। इसमें दो नवीन मॉडल शामिल हैं: SenseVoice उच्च परिशुद्धता बहुभाषी ध्वनि पहचान, भावना पहचान और ऑडियो घटनाओं के पता लगाने के लिए जिम्मेदार है; CosyVoice प्राकृतिक ध्वनि निर्माण के लिए जिम्मेदार है, जो बहुभाषी, स्वर और भावना नियंत्रण का समर्थन करता है। SenseVoice 50 से अधिक भाषाओं का समर्थन करता है, जिसमें बहुत कम विलंबता है; CosyVoice बहुभाषी ध्वनि निर्माण, शून्य-नमूना संदर्भ निर्माण, क्रॉस-भाषा ध्वनि क्लोनिंग और निर्देश अनुसरण क्षमता में कुशल है। संबंधित मॉडल Modelscope और Huggingface पर खुले स्रोत हैं, और GitHub पर संबंधित प्रशिक्षण, अनुमान और माइक्रो-ट्यूनिंग कोड जारी किया गया है।
वेबसाइट खोलें

FunAudioLLM नवीनतम ट्रैफ़िक स्थिति

मासिक कुल विज़िट

8301

बाउंस दर

53.74%

प्रति विज़िट औसत पृष्ठ

1.2

औसत विज़िट अवधि

00:00:12

FunAudioLLM विज़िट प्रवृत्ति

FunAudioLLM विज़िट भौगोलिक वितरण

FunAudioLLM ट्रैफ़िक स्रोत

FunAudioLLM विकल्प