A startup de inteligência artificial ElevenLabs lançou na quarta-feira um novo recurso chamado GenFM, que permite aos usuários carregar diferentes tipos de conteúdo para gerar podcasts multicanais, semelhante ao NotebookLM do Google.
O recurso já está disponível no aplicativo iOS do ElevenLabs Reader e suporta 32 idiomas, incluindo inglês, hindi, português, chinês, espanhol, francês, alemão e japonês.
Ao usar o GenFM, os usuários podem primeiro carregar um vídeo do YouTube, texto ou documento, e o aplicativo selecionará automaticamente duas vozes para criar o podcast.
A ElevenLabs oferece mais de dez vozes para os usuários escolherem. Enquanto o aplicativo prepara o podcast gerado por IA, os usuários podem ver dicas interessantes, como "adicione algumas pausas" e "insira alguns termos de preenchimento". Em um contexto onde muitas ferramentas ajudam as pessoas a remover "hum" e "ah", a ElevenLabs opta por adicionar elementos mais humanos aos seus podcasts gerados por IA.
Jack McDermott, chefe de crescimento móvel da ElevenLabs, disse em uma entrevista: "Discutimos até que ponto introduzir termos de preenchimento ou sons de cobertura semelhantes à conversa humana, como 'hum', 'ah', 'humm', risos e respirações. Nosso objetivo é encontrar o equilíbrio certo entre a conversa humana natural e a utilidade do conteúdo."
Ele também apontou que podcasts longos de alta qualidade tendem a ter menos interrupções, e que um fluxo de conversa mais natural e profundo é a experiência que eles buscam, com o objetivo de tornar a narrativa de áudio mais acessível em diferentes vozes e idiomas.
No futuro, a ElevenLabs planeja oferecer mais opções de personalização e permitir que os usuários adicionem várias fontes para criar podcasts de IA generativos. Em setembro, o Google lançou o recurso de conversa de IA do NotebookLM e, um mês depois, adicionou a capacidade de os usuários personalizarem a saída do podcast.
No início deste mês, a ElevenLabs também anunciou um investimento de US$ 11 milhões no ecossistema de startups polonês e a abertura de um centro de P&D em Varsóvia para atrair talentos locais de IA. Simultaneamente, a empresa está se expandindo para a Índia, contratou um chefe de negócios e está formando uma equipe. Além disso, a ElevenLabs lançou um agente de IA conversacional para seus clientes.
Destaques:
🌐 A ElevenLabs lança o recurso GenFM, permitindo que os usuários carreguem vídeos ou textos para gerar podcasts multicanais.
🎙️ O recurso seleciona automaticamente duas vozes e adiciona termos de preenchimento humanizados para melhorar a experiência de conversa natural.
🚀 A ElevenLabs planeja oferecer mais opções de personalização no futuro e expandir seus negócios na Polônia e na Índia.