Zonos-v0.1-híbrido

Zonos-v0.1-híbrido es un modelo de texto a voz (TTS) de código abierto líder que ofrece servicios de síntesis de voz de alta calidad.

Producto ComúnProductividadTexto a vozSíntesis de voz
Zonos-v0.1-híbrido es un modelo de texto a voz de código abierto desarrollado por Zyphra. Genera voz altamente natural a partir de indicaciones de texto. El modelo ha sido entrenado con una gran cantidad de datos de voz en inglés, utilizando eSpeak para la normalización y fonemización del texto, y una red neuronal transformadora o híbrida para predecir los tokens DAC. Admite varios idiomas, incluyendo inglés, japonés, chino, francés y alemán, y permite un control preciso sobre la velocidad, el tono, la calidad de audio y el estado de ánimo de la voz generada. Además, cuenta con una función de clonación de voz de muestra cero, capaz de clonar voces con alta fidelidad utilizando solo 5 a 30 segundos de muestra de voz. Tiene un factor de tiempo real de aproximadamente 2x en una RTX 4090, lo que lo hace bastante rápido. También incluye una interfaz gradio fácil de usar y se puede instalar y desplegar fácilmente mediante un archivo Docker. Actualmente se encuentra disponible en Hugging Face para uso gratuito, pero requiere despliegue propio.
Abrir sitio web

Zonos-v0.1-híbrido Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

Zonos-v0.1-híbrido Tendencia de visitas

Zonos-v0.1-híbrido Distribución geográfica de las visitas

Zonos-v0.1-híbrido Fuentes de tráfico

Zonos-v0.1-híbrido Alternativas