DiffPortrait3D
DiffPortrait3D sintetiza perspectivas 3D realistas e consistentes a partir de uma única foto de retrato em ambiente externo.
Produto ComumImagemSíntese de retratosNova perspectiva
DiffPortrait3D é um modelo de difusão condicional que sintetiza perspectivas 3D realistas e consistentes, mesmo com apenas uma única foto de retrato em ambiente externo. Especificamente, dada uma única imagem RGB de entrada, nosso objetivo é sintetizar detalhes faciais realistas renderizados a partir de uma nova perspectiva da câmera, mantendo a identidade e a expressão facial. Nosso método sem treinamento prévio generaliza bem para retratos faciais arbitrários, com perspectivas de câmera não posadas, expressões faciais extremas e diversas representações artísticas. Em seu núcleo, utilizamos o conhecimento gerador pré-treinado de um modelo de difusão 2D em um grande conjunto de dados de imagens como nossa espinha dorsal de renderização, guiando o processo de remoção de ruído através do controle de atenção direcionado, desacoplando a aparência e a pose da câmera. Para isso, primeiro injetamos o contexto de aparência da imagem de referência nas camadas de autoatenção de uma UNet congelada. Em seguida, manipulamos a perspectiva renderizada por meio de um novo módulo de controle condicional que interpreta a pose da câmera observando imagens condicionais de sujeitos transversais da mesma perspectiva. Além disso, inserimos um módulo de atenção entre vistas treinável para aprimorar a consistência entre as vistas, que é ainda mais reforçada por meio de um novo processo de geração de ruído com percepção 3D durante a inferência. Demonstramos resultados de ponta qualitativa e quantitativamente em benchmarks desafiadores de ambientes externos e multivisões.
DiffPortrait3D Situação do Tráfego Mais Recente
Total de Visitas Mensais
474564576
Taxa de Rejeição
36.20%
Média de Páginas por Visita
6.1
Duração Média da Visita
00:06:34