SenseVoiceSmall
Modelo de reconhecimento de voz de alta precisão e multi-linguagem
Produto ComumProdutividadeReconhecimento de vozAnálise de sentimentos
SenseVoiceSmall é um modelo de linguagem de base de voz com diversas capacidades de compreensão de fala, incluindo Reconhecimento Automático de Fala (ASR), Identificação de Língua Falada (LID), Reconhecimento de Emoções na Voz (SER) e Detecção de Eventos de Áudio (AED). Treinado com mais de 400.000 horas de dados, suporta mais de 50 idiomas, superando o desempenho do modelo Whisper. Seu modelo menor, SenseVoice-Small, utiliza uma estrutura de ponta a ponta não auto-regressiva, resultando em latência de inferência extremamente baixa: processa 10 segundos de áudio em apenas 70 milissegundos, 15 vezes mais rápido que o Whisper-Large. Além disso, o SenseVoice oferece scripts e estratégias de ajuste fino convenientes, e um pipeline de implantação de serviço que suporta múltiplas requisições simultâneas. As linguagens de cliente incluem Python, C++, HTML, Java e C#.
SenseVoiceSmall Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44