Bailing-TTS

Modèle de texte à parole (TTS) à grande échelle générant des voix dialectales chinoises de haute qualité.

Produit OrdinaireAutreTexte à paroleDialecte
Bailing-TTS est une série de modèles de texte à parole (TTS) de grande taille développés par le laboratoire IA de Giant Network, axés sur la génération de voix dialectales chinoises de haute qualité. Ce modèle utilise un apprentissage semi-supervisé continu et une architecture Transformer spécifique. Grâce à un processus d'entraînement multi-étapes, il aligne efficacement les marqueurs texte et parole, permettant une synthèse vocale de haute qualité des dialectes chinois. Dans les expérimentations, Bailing-TTS a démontré des résultats de synthèse vocale proches de l'expression humaine naturelle, ce qui revêt une importance significative pour le domaine de la synthèse vocale dialectale.
Ouvrir le site Web

Bailing-TTS Alternatives