SenseVoiceSmall
Modelo de reconocimiento de voz de alta precisión y multilingüe
Producto ComúnProductividadReconocimiento de vozAnálisis de sentimientos
SenseVoiceSmall es un modelo de voz básico con múltiples capacidades de comprensión del habla, incluyendo Reconocimiento Automático del Habla (ASR), Identificación del Idioma Hablado (LID), Reconocimiento de Emociones del Habla (SER) y Detección de Eventos de Audio (AED). Este modelo ha sido entrenado con más de 400.000 horas de datos, admite más de 50 idiomas y supera en rendimiento al modelo Whisper. Su modelo pequeño, SenseVoice-Small, utiliza un marco de extremo a extremo no autorregresivo, con una latencia de inferencia extremadamente baja; procesa 10 segundos de audio en solo 70 milisegundos, 15 veces más rápido que Whisper-Large. Además, SenseVoice ofrece scripts y estrategias de ajuste fino convenientes, un pipeline de implementación de servicios que admite múltiples solicitudes concurrentes, y lenguajes de cliente que incluyen Python, C++, HTML, Java y C#.
SenseVoiceSmall Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44