audio2photoreal
Gera avatares humanos fotorrealistas a partir de áudio
Produto ComumImagemIASíntese de Voz
O audio2photoreal é um projeto de código aberto que gera avatares fotorrealistas a partir de áudio. Ele inclui uma implementação PyTorch que sintetiza imagens humanas em conversação a partir de áudio. O projeto fornece código de treinamento, código de teste, modelos de movimento pré-treinados e acesso ao conjunto de dados. Seus modelos incluem um modelo de difusão facial, um modelo de difusão corporal, um modelo VQ-VAE corporal e um modelo de transformador guiado por corpo. O projeto permite que pesquisadores e desenvolvedores treinem seus próprios modelos e sintetizem avatares realistas de alta qualidade com base em voz.
audio2photoreal Situação do Tráfego Mais Recente
Total de Visitas Mensais
474564576
Taxa de Rejeição
36.20%
Média de Páginas por Visita
6.1
Duração Média da Visita
00:06:34