SenseVoiceSmall
Modèle de reconnaissance vocale haute précision multilingue
Produit OrdinaireProductivitéReconnaissance vocaleAnalyse des sentiments
SenseVoiceSmall est un modèle de base vocal doté de multiples capacités de compréhension de la parole, incluant la reconnaissance automatique de la parole (ASR), l'identification de la langue parlée (LID), la reconnaissance des émotions vocales (SER) et la détection d'événements audio (AED). Entraîné sur plus de 400 000 heures de données, il prend en charge plus de 50 langues et surpasse les performances du modèle Whisper. Son modèle compact, SenseVoice-Small, utilise une architecture non auto-régréssive de bout en bout, offrant une latence d'inférence extrêmement faible : le traitement d'un fichier audio de 10 secondes ne prend que 70 ms, soit 15 fois plus rapide que Whisper-Large. De plus, SenseVoice fournit des scripts et des stratégies d'ajustement fin pratiques, ainsi qu'un pipeline de déploiement de service prenant en charge les requêtes multi-concurrentes. Les langages clients incluent Python, C++, HTML, Java et C#.
SenseVoiceSmall Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44