Seed-ASR
Tecnologia de reconhecimento de voz baseada em modelos de linguagem de grande porte.
Novo Produto PremiumOutrosReconhecimento de vozModelos de linguagem de grande porte
O Seed-ASR é um modelo de reconhecimento de voz baseado em modelos de linguagem de grande porte (Large Language Model, LLM) desenvolvido pela ByteDance. Ao inserir a representação contínua da fala e informações contextuais no LLM, e utilizando a capacidade do LLM, sob a orientação do treinamento em larga escala e da capacidade de percepção de contexto, o Seed-ASR melhora significativamente o desempenho em conjuntos de avaliação abrangentes que incluem múltiplos domínios, sotaques/dialetos e idiomas. Em comparação com os modelos ASR de grande porte lançados recentemente, o Seed-ASR alcançou uma redução de 10% a 40% na taxa de erro de palavras em conjuntos de testes públicos em chinês e inglês, demonstrando ainda mais seu poderoso desempenho.
Seed-ASR Situação do Tráfego Mais Recente
Total de Visitas Mensais
16826
Taxa de Rejeição
42.75%
Média de Páginas por Visita
2.8
Duração Média da Visita
00:02:20