La startup d'intelligence artificielle ElevenLabs a lancé mercredi une nouvelle fonctionnalité, GenFM, permettant aux utilisateurs de télécharger différents types de contenu pour générer des podcasts multi-voix, similaires à NotebookLM de Google.
Cette fonctionnalité est déjà disponible sur l'application iOS ElevenLabs Reader et prend en charge 32 langues, dont l'anglais, l'hindi, le portugais, le chinois, l'espagnol, le français, l'allemand et le japonais.
Avec GenFM, les utilisateurs peuvent télécharger des vidéos YouTube, du texte ou des documents. L'application sélectionne automatiquement deux voix pour créer le podcast.
ElevenLabs propose plus d'une dizaine de voix au choix. Lors de la préparation du podcast généré par l'IA, les utilisateurs peuvent voir des suggestions intéressantes comme "ajouter des pauses" et "insérer des mots de remplissage". Alors que de nombreux outils actuels aident à supprimer les "euh" et les "hum", ElevenLabs choisit d'ajouter des éléments plus humains à ses podcasts générés par l'IA.
Jack McDermott, responsable de la croissance mobile chez ElevenLabs, a déclaré lors d'une interview : "Nous avons discuté de la mesure dans laquelle introduire des mots de remplissage ou des sons de couverture similaires à la conversation humaine, tels que 'euh', 'hum', 'hein', des rires et des respirations. Notre objectif est de trouver le juste équilibre entre une conversation humaine naturelle et la fonctionnalité du contenu."
Il a également souligné que les excellents podcasts longs contiennent souvent moins d'interruptions, et que le flux de conversation plus naturel et plus approfondi est l'expérience qu'ils recherchent, visant à rendre le récit audio plus accessible dans différentes voix et langues.
À l'avenir, ElevenLabs prévoit de prendre en charge davantage d'options de personnalisation et de permettre aux utilisateurs d'ajouter plusieurs sources pour créer des podcasts génératifs par IA. En septembre, Google a lancé la fonction de dialogue génératif par IA de NotebookLM, et a ajouté un mois plus tard la possibilité pour les utilisateurs de personnaliser la sortie du podcast.
Début de ce mois-ci, ElevenLabs a également annoncé un investissement de 11 millions de dollars dans l'écosystème des startups polonaises et l'ouverture d'un centre de R&D à Varsovie pour attirer les talents locaux en IA. Simultanément, la société s'étend en Inde, ayant déjà recruté un responsable commercial et en train de constituer une équipe. De plus, ElevenLabs a lancé un agent conversationnel IA pour ses clients.
Points clés :
🌐 ElevenLabs lance la fonctionnalité GenFM, permettant aux utilisateurs de télécharger des vidéos ou du texte pour générer des podcasts multi-voix.
🎙️ Cette fonctionnalité sélectionne automatiquement deux voix et ajoute des mots de remplissage humains pour améliorer l'expérience de conversation naturelle.
🚀 ElevenLabs prévoit à l'avenir de prendre en charge davantage d'options de personnalisation et d'étendre ses activités en Pologne et en Inde.