ChinaZ.com (站长之家) - 18 de junho de 2024: A ElevenLabs, uma empresa focada em tecnologia de geração de áudio, anunciou recentemente sua entrada no campo da geração de vídeo. Eles lançaram um projeto de código aberto que pode automaticamente dublar vídeos carregados e gerar efeitos sonoros apropriados.

Este projeto é baseado em sua ferramenta de geração de efeitos sonoros a partir de texto, podendo ser considerado uma versão simplificada do Google V2A. A ferramenta já está disponível para os usuários.

No início de junho, a ElevenLabs lançou um novo recurso que permite aos usuários gerar diversos efeitos sonoros realistas a partir de texto. Este recurso é uma grande ajuda para indústrias como cinema, jogos e vídeos curtos. Ele elimina a necessidade de procurar efeitos sonoros manualmente, e a maioria dos efeitos sonoros possui licença comercial do Shutterstock.

Além da geração de efeitos sonoros, a ElevenLabs oferece outros recursos poderosos, como clonagem de voz e conversão de texto em fala. Os usuários podem carregar um trecho de áudio para extrair características e gerar novos conteúdos de texto; também podem converter grandes trechos de texto em áudio com emoção, dando uma forma mais vívida ao conteúdo. Embora o suporte ao chinês seja limitado, a geração de conteúdo em inglês é excelente.

Acesso à conversão de texto em áudio: https://top.aibase.com/tool/elevenlabs-wenbenzhuanyinxiaoapi

Acesso à dublagem automática de vídeo: https://top.aibase.com/tool/elevenlabs-texts-to-sounds-effects-api