En el dinámico campo de los podcasts, la plataforma Podcastle ha anunciado recientemente el lanzamiento de su nuevo modelo de texto a voz con IA, Asyncflow v1.0. Este nuevo modelo no solo ofrece a los usuarios más de 450 voces de IA diferentes, sino que también proporciona una API a los desarrolladores para que puedan integrar fácilmente esta función de texto a voz en sus propias aplicaciones.
El fundador de Podcastle, Arto Yeritsyan, afirma que la empresa siempre había querido desarrollar un modelo de texto a voz, pero que el alto coste de entrenamiento y las necesidades de datos lo habían impedido hasta ahora. Sin embargo, gracias a los avances en la tecnología de los grandes modelos lingüísticos de los últimos años, Podcastle logró un gran avance el año pasado, consiguiendo construir modelos de voz de alta calidad sin necesidad de grandes cantidades de datos. Yeritsyan añadió que la investigación y el desarrollo de Podcastle han contado con el apoyo de una ronda de financiación Serie A de 13,5 millones de dólares el año pasado, lo que ha garantizado su innovación tecnológica.
En cuanto al precio, el servicio de texto a voz de Podcastle cuesta alrededor de 40 dólares por 500 minutos, mientras que su competidor ElevenLabs cobra 99 dólares. Además del modelo de texto a voz, la función de clonación de voz de Podcastle también se ha mejorado, reduciendo el proceso de entrenamiento de las 70 frases diferentes que se necesitaban antes a una grabación de solo unos segundos. El nuevo proceso utiliza la tecnología Magic Dust AI, lanzada por Podcastle el año pasado, que mejora significativamente la calidad de la grabación de audio.
En las pruebas realizadas, aunque las voces generadas suenan ligeramente robóticas, imitan bastante bien la entonación del hablante. Podcastle afirma que esta función mejorará con el tiempo y que los usuarios podrán entrenar diferentes efectos de voz utilizando diferentes muestras de grabación.
Yeritsyan señala que, además de la ventaja de coste, la integración de herramientas de audio, vídeo, podcast y narración impulsadas por IA en un sitio web rediseñado también ayudará a Podcastle a destacar en la competencia. Menciona que, aunque la mayoría de los usuarios siguen utilizando principalmente Podcastle para la creación de contenido de audio, la demanda de producción de vídeo también está aumentando.
Enlace:https://podcastle.ai/ai-voices
Puntos clave:
🌟 Podcastle lanza el modelo Asyncflow v1.0, ofreciendo más de 450 voces de IA.
💰 El precio del servicio de texto a voz es de 40 dólares por 500 minutos, inferior al de la competencia.
🎤 La función de clonación de voz se ha mejorado, reduciendo drásticamente el tiempo de entrenamiento y optimizando la experiencia del usuario.