ZyphraAI ha lanzado recientemente su último modelo de texto a voz (TTS) multilingüe, Zonos-TTS, basado en la licencia Apache2.0, completamente de código abierto y con licencia comercial. Zonos-TTS no solo admite la función de clonación de voz en tiempo real, sino que también se ha entrenado con 200.000 horas de datos de voz en inglés, mostrando un rendimiento excepcional.

Zonos-TTS ofrece dos métodos de implementación: admite la implementación local y un práctico servicio de API. Para los usuarios comunes, ZyphraAI ofrece un servicio gratuito de generación de 100 minutos de audio al mes; los usuarios profesionales pueden optar por un paquete de 300 minutos/5 dólares, y la parte que exceda se cobrará a 0,02 dólares por minuto.

Cabe destacar que la función de clonación de voz en tiempo real es completamente gratuita y admite una alta calidad de audio y control emocional, lo que ofrece a los usuarios una gran flexibilidad y utilidad.

Además, Zonos-TTS también admite la entrada de prefijos de audio, lo que mejora aún más sus escenarios de aplicación. Según las pruebas de ZyphraAI, en una tarjeta gráfica RTX4090, el modelo puede funcionar a aproximadamente el doble de la velocidad en tiempo real, mostrando una alta eficiencia. Este lanzamiento de código abierto proporciona a los desarrolladores y empresas una herramienta potente y flexible que impulsa el desarrollo de la tecnología de clonación de voz en tiempo real multilingüe.

Dirección: https://huggingface.co/Zyphra/Zonos-v0.1-hybrid