FLOAT
Método de geração de vídeo de avatar falante baseado em áudio e em correspondência de fluxo
Produto ComumImagemInteligência ArtificialAnimação de rostos
FLOAT é um método de geração de vídeo de avatar falante baseado em áudio, que utiliza um modelo de geração baseado em correspondência de fluxo. Este método transfere o processo de modelagem de geração do espaço latente baseado em pixels para um espaço latente de movimento aprendido, resultando em um design de movimento consistente no tempo. A técnica incorpora um preditor de campo vetorial baseado em Transformer e possui um mecanismo condicional simples e eficiente quadro a quadro. Além disso, o FLOAT suporta o aumento de emoções baseado em voz, permitindo a integração natural de movimentos expressivos. Experimentos abrangentes demonstram que o FLOAT supera os métodos existentes de geração de avatar falante baseado em áudio em termos de qualidade visual, fidelidade de movimento e eficiência.
FLOAT Situação do Tráfego Mais Recente
Total de Visitas Mensais
2062
Taxa de Rejeição
55.17%
Média de Páginas por Visita
1.1
Duração Média da Visita
00:00:01