Dans le secteur dynamique des podcasts, la plateforme Podcastle a récemment annoncé le lancement de son nouveau modèle de synthèse vocale IA, Asyncflow v1.0. Ce nouveau modèle offre aux utilisateurs plus de 450 voix IA différentes et met une API à la disposition des développeurs pour intégrer facilement cette fonctionnalité de conversion texte-parole dans leurs propres applications.

QQ_1741058363798.png

Arto Yeritsyan, fondateur de Podcastle, explique que l'entreprise souhaitait depuis longtemps développer un modèle de synthèse vocale, mais que les coûts de formation élevés et les besoins en données importants du passé ont rendu cela impossible. Cependant, grâce aux progrès récents des grands modèles linguistiques, Podcastle a finalement réalisé une percée l'année dernière, permettant de construire des modèles vocaux de haute qualité sans avoir besoin d'énormes quantités de données. Yeritsyan ajoute que la recherche et le développement de Podcastle ont bénéficié d'un financement de série A de 13,5 millions de dollars l'année dernière, ce qui a considérablement soutenu son innovation technologique.

En termes de prix, le service de synthèse vocale de Podcastle est fixé à environ 40 dollars pour 500 minutes, contre 99 dollars chez son concurrent ElevenLabs. En plus du modèle de synthèse vocale, la fonction de clonage vocal de Podcastle a également été améliorée : le processus d'entraînement, qui nécessitait auparavant la lecture de 70 phrases différentes, est désormais réduit à quelques secondes d'enregistrement. Ce nouveau processus utilise la technologie Magic Dust IA lancée par Podcastle l'année dernière, améliorant considérablement la qualité de l'enregistrement audio.

Lors des tests, bien que les nouvelles voix sonnent légèrement robotiques, elles imitent assez bien le ton de la parole. Podcastle indique que cette fonctionnalité s'améliorera avec le temps et que les utilisateurs pourront également entraîner différents effets sonores à partir de différents échantillons d'enregistrement.

Yeritsyan souligne que, outre l'avantage en termes de coûts, l'intégration des outils audio, vidéo, de podcast et de narration pilotés par l'IA dans un site Web redessiné permettra à Podcastle de se démarquer de la concurrence. Il mentionne que, bien que la plupart des utilisateurs utilisent encore principalement Podcastle pour la création de contenu audio, la demande de création vidéo est en augmentation.

Lien : https://podcastle.ai/ai-voices

Points clés :

🌟 Podcastle lance le modèle Asyncflow v1.0, offrant plus de 450 voix IA.

💰 Le coût de la synthèse vocale sur la plateforme est de 40 dollars pour 500 minutes, un prix inférieur à celui de ses concurrents.

🎤 La fonction de clonage vocal a été améliorée, le temps d'entraînement a été considérablement réduit et l'expérience utilisateur est constamment optimisée.