SenseVoiceSmall
बहुभाषी उच्च-परिशुद्धता वाक् पहचान मॉडल
सामान्य उत्पादउत्पादकतावाक् पहचानभावना विश्लेषण
SenseVoiceSmall एक ऐसा बुनियादी वाक् मॉडल है जिसमें कई प्रकार की वाक् समझ क्षमताएँ हैं, जिनमें स्वचालित वाक् पहचान (ASR), मौखिक भाषा पहचान (LID), वाक् भावना पहचान (SER) और ऑडियो घटना पता लगाना (AED) शामिल हैं। यह मॉडल 40 लाख घंटे से अधिक डेटा प्रशिक्षण से गुज़रा है, 50 से अधिक भाषाओं का समर्थन करता है, और Whisper मॉडल से बेहतर पहचान प्रदर्शन करता है। इसका छोटा मॉडल SenseVoice-Small एक गैर-स्वप्रतिगमन अंत-से-अंत ढाँचे का उपयोग करता है, जिससे अनुमान में देरी बहुत कम होती है, 10 सेकंड के ऑडियो को संसाधित करने में केवल 70 मिलीसेकंड का समय लगता है, जो Whisper-Large से 15 गुना तेज है। इसके अतिरिक्त, SenseVoice सुविधाजनक माइक्रोट्यूनिंग स्क्रिप्ट और रणनीतियाँ प्रदान करता है, जो कई समवर्ती अनुरोधों का समर्थन करने वाले सेवा परिनियोजन पाइपलाइन का समर्थन करता है, जिसमें क्लाइंट भाषाओं में Python, C++, HTML, Java और C# शामिल हैं।
SenseVoiceSmall नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
29742941
बाउंस दर
44.20%
प्रति विज़िट औसत पृष्ठ
5.9
औसत विज़िट अवधि
00:04:44