SenseVoice
बहुभाषी भाषण समझ मॉडल, उच्च-परिशुद्धता भाषण पहचान और भावना पहचान प्रदान करता है।
सामान्य उत्पादअन्यभाषण पहचानभावना विश्लेषण
SenseVoice एक भाषण आधार मॉडल है जिसमें स्वचालित भाषण पहचान (ASR), भाषण भाषा पहचान (LID), भाषण भावना पहचान (SER) और ऑडियो घटना पता लगाने (AED) जैसी बहु-भाषण समझ क्षमताएँ शामिल हैं। यह उच्च-परिशुद्धता बहुभाषी भाषण पहचान, भाषण भावना पहचान और ऑडियो घटना पता लगाने पर केंद्रित है, जो 50 से अधिक भाषाओं का समर्थन करता है, और Whisper मॉडल से बेहतर पहचान प्रदर्शन प्रदान करता है। मॉडल एक गैर-स्वप्रेरक एंड-टू-एंड ढांचे का उपयोग करता है, जिसमें अनुमान विलंब बहुत कम है, जो वास्तविक समय भाषण प्रसंस्करण के लिए आदर्श है।
SenseVoice नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
474564576
बाउंस दर
36.20%
प्रति विज़िट औसत पृष्ठ
6.1
औसत विज़िट अवधि
00:06:34