Bailing-TTS

Modelo de texto para fala (TTS) em larga escala que gera áudio em diversos dialetos chineses de alta qualidade.

Produto ComumOutrosTexto para falaDialeto
Bailing-TTS é uma série de modelos de texto para fala (TTS) de grande porte desenvolvidos pelo AI Lab da Giant Network, focados na geração de áudio em dialetos chineses de alta qualidade. O modelo emprega aprendizado semi-supervisionado contínuo e uma arquitetura Transformer específica, utilizando um processo de treinamento multi-estágio para alinhar efetivamente as marcas de texto e áudio, alcançando a síntese de fala de alta qualidade em dialetos chineses. Em experimentos, o Bailing-TTS demonstrou resultados de síntese de fala próximos à expressão humana natural, sendo de grande importância para o campo da síntese de fala em dialetos.
Abrir Site

Bailing-TTS Alternativas