Zonos-v0.1-híbrido
Zonos-v0.1-híbrido es un modelo de texto a voz (TTS) de código abierto líder que ofrece servicios de síntesis de voz de alta calidad.
Producto ComúnProductividadTexto a vozSíntesis de voz
Zonos-v0.1-híbrido es un modelo de texto a voz de código abierto desarrollado por Zyphra. Genera voz altamente natural a partir de indicaciones de texto. El modelo ha sido entrenado con una gran cantidad de datos de voz en inglés, utilizando eSpeak para la normalización y fonemización del texto, y una red neuronal transformadora o híbrida para predecir los tokens DAC. Admite varios idiomas, incluyendo inglés, japonés, chino, francés y alemán, y permite un control preciso sobre la velocidad, el tono, la calidad de audio y el estado de ánimo de la voz generada. Además, cuenta con una función de clonación de voz de muestra cero, capaz de clonar voces con alta fidelidad utilizando solo 5 a 30 segundos de muestra de voz. Tiene un factor de tiempo real de aproximadamente 2x en una RTX 4090, lo que lo hace bastante rápido. También incluye una interfaz gradio fácil de usar y se puede instalar y desplegar fácilmente mediante un archivo Docker. Actualmente se encuentra disponible en Hugging Face para uso gratuito, pero requiere despliegue propio.
Zonos-v0.1-híbrido Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44