No setor de podcasts em rápida expansão, a plataforma Podcastle anunciou recentemente o lançamento de seu novo modelo de texto para fala com IA, Asyncflow v1.0. Este novo modelo não apenas oferece aos usuários mais de 450 vozes de IA diferentes, mas também disponibiliza uma API para desenvolvedores, permitindo que integrem diretamente essa funcionalidade de texto para fala em seus próprios aplicativos.

QQ_1741058363798.png

O fundador da Podcastle, Arto Yeritsyan, disse que a empresa sempre quis desenvolver um modelo de texto para fala, mas devido aos altos custos de treinamento e às necessidades de dados no passado, esse desejo nunca foi realizado. No entanto, com o avanço da tecnologia de modelos de linguagem grandes nos últimos anos, a Podcastle finalmente conseguiu uma grande descoberta no ano passado, conseguindo construir modelos de voz de alta qualidade sem precisar de uma grande quantidade de dados. Yeritsyan acrescentou que o desenvolvimento da Podcastle foi apoiado por uma rodada de financiamento Série A de US$ 13,5 milhões no ano passado, o que forneceu uma garantia importante para sua inovação tecnológica.

Em termos de preço, o serviço de texto para fala da Podcastle é precificado em cerca de US$ 40 por 500 minutos, em comparação com US$ 99 cobrados pela concorrente ElevenLabs. Além do modelo de texto para fala, o recurso de clonagem de voz da Podcastle também foi atualizado, com o processo de treinamento reduzido de 70 frases diferentes para apenas alguns segundos de gravação. O novo processo utiliza a tecnologia Magic Dust AI lançada pela Podcastle no ano passado, melhorando significativamente a qualidade da gravação de áudio.

Em testes práticos, embora a nova voz gerada soe um pouco robótica, ela ainda consegue imitar bem o tom de voz do falante. A Podcastle afirma que, com o tempo, essa funcionalidade será aprimorada e os usuários também poderão treinar diferentes efeitos sonoros por meio de diferentes amostras de gravação.

Yeritsyan apontou que, além da vantagem de custo, a integração de ferramentas de áudio, vídeo, podcast e narração com IA em um site redesenhado também permitirá que a Podcastle se destaque na competição. Ele mencionou que, embora a maioria dos usuários ainda use principalmente a Podcastle para criação de conteúdo de áudio, a demanda por produção de vídeo também está aumentando gradualmente.

Entrada:https://podcastle.ai/ai-voices

Destaques:

🌟 A Podcastle lança o modelo Asyncflow v1.0, oferecendo mais de 450 vozes de IA.

💰 A plataforma cobra US$ 40 por 500 minutos de conversão de texto para fala, um preço inferior ao da concorrência.

🎤 O recurso de clonagem de voz foi atualizado, com tempo de treinamento significativamente reduzido e experiência do usuário continuamente otimizada.