AnyDoor
Provador virtual, movimentação de objetos
Produto ComumImagemImagemZero-shot
AnyDoor é um gerador de imagens baseado em difusão que permite transportar objetos-alvo para novas cenas de forma harmoniosa, na posição especificada pelo usuário. Nosso modelo requer apenas um treinamento único e pode ser facilmente generalizado para diferentes combinações de objetos e cenas, sem necessidade de ajuste de parâmetros para cada objeto. Para descrever completamente um objeto específico, além das características de identidade comumente usadas, adicionamos características de detalhe cuidadosamente projetadas para manter detalhes de textura e permitir variações locais diversas (como iluminação, orientação, pose, etc.), permitindo que o objeto se integre melhor a diferentes ambientes. Também propomos um método para emprestar conhecimento de conjuntos de dados de vídeo, onde diversas formas do mesmo objeto podem ser observadas (ao longo do eixo do tempo), aumentando a capacidade de generalização e a robustez do modelo. Vários experimentos demonstram a superioridade do nosso método e seu enorme potencial em aplicações práticas, como provador virtual e movimentação de objetos.