ZyphraAI a récemment publié son dernier modèle de synthèse vocale (TTS) multilingue, Zonos-TTS. Ce modèle est entièrement open source et utilisable commercialement sous licence Apache2.0. Zonos-TTS prend non seulement en charge le clonage vocal en temps réel, mais il a également été entraîné sur 200 000 heures de données vocales en anglais, démontrant ainsi des performances exceptionnelles.
Zonos-TTS offre deux modes de déploiement : un déploiement local et un service API pratique. Pour les utilisateurs standard, ZyphraAI offre 100 minutes de génération audio gratuites par mois ; les utilisateurs professionnels peuvent opter pour un forfait de 300 minutes/5 $, les minutes supplémentaires étant facturées 0,02 $ la minute.
Il est particulièrement important de noter que la fonction de clonage vocal en temps réel est entièrement gratuite et prend en charge une haute qualité audio et le contrôle des émotions, offrant ainsi aux utilisateurs une grande flexibilité et une grande praticité.
De plus, Zonos-TTS prend en charge l'entrée de préfixe audio, améliorant encore ses cas d'utilisation. Selon les tests de ZyphraAI, sur une carte graphique RTX4090, le modèle peut fonctionner à environ deux fois la vitesse réelle, démontrant une efficacité extrêmement élevée. Cette publication open source fournit aux développeurs et aux entreprises un outil puissant et flexible pour promouvoir le développement de la technologie de clonage vocal en temps réel multilingue.
Adresse : https://huggingface.co/Zyphra/Zonos-v0.1-hybrid