StreamSpeech
Tradução de voz em tempo real, uma ponte para comunicação interlinguística.
Novo Produto PremiumProdutividadeTradução em tempo realAprendizado de múltiplas tarefas
O StreamSpeech é um modelo de tradução de voz para voz em tempo real baseado em aprendizado de múltiplas tarefas. Ele aprende simultaneamente as estratégias de tradução e sincronização por meio de uma estrutura unificada, identificando efetivamente o momento ideal da tradução na entrada de voz em fluxo, resultando em uma experiência de comunicação em tempo real de alta qualidade. O modelo alcançou desempenho de ponta em testes de referência do CVSS e pode fornecer resultados intermediários de baixa latência, como ASR ou resultados de tradução.