Fashion-VDM est un modèle de diffusion vidéo (VDM) conçu pour générer des vidéos d'essayage virtuel. Le modèle prend en entrée une image d'un vêtement et une vidéo d'une personne, et vise à générer une vidéo d'essayage de haute qualité de la personne portant le vêtement donné, tout en préservant l'identité et les mouvements de la personne. Comparé aux essayages virtuels traditionnels basés sur l'image, Fashion-VDM excelle en termes de détails du vêtement et de cohérence temporelle. Les principaux avantages de cette technologie incluent : une architecture de diffusion, un guidage libre par classificateur pour un meilleur contrôle, une stratégie d'entraînement temporel progressif permettant de générer des vidéos de 64 images 512px en une seule fois, et l'efficacité de l'entraînement conjoint image-vidéo. Fashion-VDM établit une nouvelle norme industrielle dans le domaine de l'essayage virtuel vidéo.