SenseVoiceSmall

Modelo de reconocimiento de voz de alta precisión y multilingüe

Producto ComúnProductividadReconocimiento de vozAnálisis de sentimientos
SenseVoiceSmall es un modelo de voz básico con múltiples capacidades de comprensión del habla, incluyendo Reconocimiento Automático del Habla (ASR), Identificación del Idioma Hablado (LID), Reconocimiento de Emociones del Habla (SER) y Detección de Eventos de Audio (AED). Este modelo ha sido entrenado con más de 400.000 horas de datos, admite más de 50 idiomas y supera en rendimiento al modelo Whisper. Su modelo pequeño, SenseVoice-Small, utiliza un marco de extremo a extremo no autorregresivo, con una latencia de inferencia extremadamente baja; procesa 10 segundos de audio en solo 70 milisegundos, 15 veces más rápido que Whisper-Large. Además, SenseVoice ofrece scripts y estrategias de ajuste fino convenientes, un pipeline de implementación de servicios que admite múltiples solicitudes concurrentes, y lenguajes de cliente que incluyen Python, C++, HTML, Java y C#.
Abrir sitio web

SenseVoiceSmall Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

SenseVoiceSmall Tendencia de visitas

SenseVoiceSmall Distribución geográfica de las visitas

SenseVoiceSmall Fuentes de tráfico

SenseVoiceSmall Alternativas