Zonos-v0.1-hybride
Zonos-v0.1-hybride est un modèle open source de texte à parole de pointe, capable de fournir des services de synthèse vocale de haute qualité.
Produit OrdinaireProductivitéTexte à paroleSynthèse vocale
Zonos-v0.1-hybride est un modèle open source de texte à parole développé par Zyphra. Il est capable de générer une parole hautement naturelle à partir d'une invite textuelle. Ce modèle a été entraîné sur un vaste ensemble de données vocales en anglais, utilisant eSpeak pour la normalisation et la phonétisation du texte, puis un transformateur ou un réseau neuronal convolutif hybride pour prédire les jetons DAC. Il prend en charge plusieurs langues, notamment l'anglais, le japonais, le chinois, le français et l'allemand, et permet un contrôle précis de la vitesse, du ton, de la qualité audio et des émotions de la parole générée. De plus, il possède une fonctionnalité de clonage vocal zéro-shot, nécessitant seulement 5 à 30 secondes d'échantillon vocal pour réaliser un clonage vocal haute fidélité. Le facteur temps réel sur une RTX 4090 est d'environ 2x, ce qui le rend relativement rapide. Il est également doté d'une interface gradio conviviale et peut être facilement installé et déployé via un fichier Docker. Actuellement, ce modèle est disponible sur Hugging Face et est gratuit pour les utilisateurs, mais nécessite un déploiement indépendant.
Zonos-v0.1-hybride Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44