Fashion-VDM é um modelo de difusão de vídeo (VDM) usado para gerar vídeos de prova virtual. O modelo recebe como entrada uma imagem de uma roupa e um vídeo de uma pessoa, com o objetivo de gerar um vídeo de alta qualidade da pessoa vestindo a roupa fornecida, mantendo a identidade e os movimentos da pessoa. Comparado com as provas virtuais tradicionais baseadas em imagens, o Fashion-VDM apresenta excelente desempenho em detalhes da roupa e consistência temporal. As principais vantagens da tecnologia incluem: arquitetura de difusão, orientação livre do classificador para controle aprimorado, estratégia de treinamento temporal progressivo para geração de vídeos de 64 quadros a 512 px em uma única vez e a eficácia do treinamento conjunto de imagem e vídeo. O Fashion-VDM estabelece um novo padrão na área de provas virtuais em vídeo.