OuteTTS-0.2-500M
Modèle de synthèse vocale haute performance
Produit OrdinaireMusiqueTexte-à-paroleSynthèse vocale
OuteTTS-0.2-500M est un modèle de synthèse vocale texte-à-parole basé sur Qwen-2.5-0.5B. Entraîné sur un ensemble de données plus vaste, il offre des améliorations significatives en termes de précision, de naturalité, de vocabulaire, de capacité de clonage vocal et de prise en charge multilingue. Ce modèle a bénéficié du soutien de Hugging Face sous forme d'un don de ressources GPU, ce qui a permis son entraînement.
OuteTTS-0.2-500M Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44