Modèles de synthèse vocale texte-parole de Stability AI

Modèles de synthèse vocale haute fidélité de Stability AI

Produit OrdinaireAutreSynthèse vocaleHaute fidélité
Les modèles de synthèse vocale haute fidélité de Stability AI visent à fournir une génération de parole guidée par le langage naturel pour des modèles de synthèse vocale entraînés sur des ensembles de données à grande échelle. Ils utilisent une approche de guidage par le langage naturel en annotant différentes identités de locuteurs, styles et conditions d'enregistrement. Cette méthode est ensuite appliquée à un ensemble de données de 45 000 heures pour entraîner le modèle de langage vocal. De plus, le modèle propose des méthodes simples pour améliorer la fidélité audio, obtenant d'excellents résultats malgré une dépendance totale aux données découvertes.
Ouvrir le site Web

Modèles de synthèse vocale texte-parole de Stability AI Alternatives