SenseVoiceSmall

Modelo de reconhecimento de voz de alta precisão e multi-linguagem

Produto ComumProdutividadeReconhecimento de vozAnálise de sentimentos
SenseVoiceSmall é um modelo de linguagem de base de voz com diversas capacidades de compreensão de fala, incluindo Reconhecimento Automático de Fala (ASR), Identificação de Língua Falada (LID), Reconhecimento de Emoções na Voz (SER) e Detecção de Eventos de Áudio (AED). Treinado com mais de 400.000 horas de dados, suporta mais de 50 idiomas, superando o desempenho do modelo Whisper. Seu modelo menor, SenseVoice-Small, utiliza uma estrutura de ponta a ponta não auto-regressiva, resultando em latência de inferência extremamente baixa: processa 10 segundos de áudio em apenas 70 milissegundos, 15 vezes mais rápido que o Whisper-Large. Além disso, o SenseVoice oferece scripts e estratégias de ajuste fino convenientes, e um pipeline de implantação de serviço que suporta múltiplas requisições simultâneas. As linguagens de cliente incluem Python, C++, HTML, Java e C#.
Abrir Site

SenseVoiceSmall Situação do Tráfego Mais Recente

Total de Visitas Mensais

29742941

Taxa de Rejeição

44.20%

Média de Páginas por Visita

5.9

Duração Média da Visita

00:04:44

SenseVoiceSmall Tendência de Visitas

SenseVoiceSmall Distribuição Geográfica das Visitas

SenseVoiceSmall Fontes de Tráfego

SenseVoiceSmall Alternativas