Recentemente, a Hedra Labs lançou uma versão de pré-visualização de pesquisa do Character-1, uma tecnologia que permite aos usuários gerar vídeos dinâmicos de pessoas falando e cantando com base em fotos e conteúdo de áudio de qualquer pessoa.
Imagine: você carrega uma foto de uma pessoa e adiciona qualquer conteúdo de áudio, e instantaneamente gera um vídeo dinâmico que faz a pessoa na foto parecer ganhar vida, começar a falar ou cantar, com sincronização perfeita entre lábios, expressões e postura com o conteúdo de áudio! Não é incrível?
Vídeo de demonstração oficial da Hedra Labs
Principais características e destaques de funcionalidades:
Compatibilidade multiplataforma: usuários podem usar o Character-1 facilmente em desktops e dispositivos móveis.
Geração de duração ilimitada: a versão de pré-visualização atualmente suporta a geração de vídeos de 30 segundos. Com fornecimento suficiente de H100, é possível gerar 90 segundos de conteúdo a cada 60 segundos.
Suporte a diversas formas de expressão: o Character-1 não apenas suporta diálogos, mas também processa formas de expressão como canto e rap.
A Hedra oferece uma interface amigável, facilitando o uso mesmo para não profissionais. Os usuários podem acessar o site da Hedra, usar a função de texto para fala ou carregar arquivos de áudio diretamente, inserir a descrição do personagem e, em seguida, gerar o vídeo dinâmico.
A tecnologia de IA da Hedra garante a alta qualidade e realismo do conteúdo do vídeo. As expressões, posturas e sincronização de áudio dos personagens são satisfatórias.
De acordo com os exemplos fornecidos pela empresa, o Character-1 pode interpretar perfeitamente canções, atuar e representar personagens com diferentes emoções. A tecnologia não se limita a personagens humanos; ela também pode gerar objetos inanimados expressivos, desde que possuam características faciais distintas.
O uso é muito simples. As etapas são as seguintes:
Acesse o endereço de experiência da Hedra: https://top.aibase.com/tool/hedra
Após acessar a página, você verá esta interface:
A interface é simples. No primeiro campo, insira o diálogo do seu personagem e selecione uma voz. Se você não quiser usar o áudio gerado, pode importar seu próprio áudio.
Aqui, eu simplesmente digitei: “Olá, este é um vídeo falado criado pela AIBase. Hoje, vamos experimentar a Hedra, tornando a geração de vídeos tão simples quanto respirar”.
Em seguida, no segundo campo, carreguei a imagem que eu queria que falasse. Neste caso, carreguei uma foto minha que fiz antes.
Se você não tiver uma imagem pronta, pode inserir a descrição do seu personagem na caixa de texto abaixo e clicar em “Criar” para gerar uma.
Após carregar a imagem, clique em “Gerar vídeo” na parte inferior do terceiro campo.
Aqui está o resultado do vídeo gerado:
Como você pode ver, o vídeo falado gerado pela Hedra é bastante animado; não se limita apenas ao movimento dos lábios, mas também inclui o movimento de outras partes do corpo e expressões. No entanto, como a plataforma oferece poucas opções de voz, o sotaque estrangeiro não combina muito bem com a imagem da minha personagem. Além disso, o vídeo gerado ficou um pouco mais embaçado do que a minha imagem original. Espero que a plataforma melhore a qualidade da imagem no futuro.
Aqui, eu carreguei um áudio que gerei no CapCut, selecionando uma voz feminina e inserindo o texto para leitura.
Vamos testar novamente:
Selecionando a opção de importar áudio:
O resultado é o seguinte:
O problema de embaçamento pode ser resolvido usando a função de aprimoramento de vídeo do Krea AI. No entanto, é importante notar que a versão de teste gratuita limita a duração do vídeo a 10 segundos. Vídeos mais longos precisam ser cortados. Além disso, não selecione uma taxa de quadros muito alta. Eu selecionei 60 quadros por segundo, e a edição parou no meio, exigindo uma atualização paga. Que frustração!