ViViD एक नया ढाँचा है जो वीडियो वर्चुअल ट्राई-ऑन के लिए डिफ्यूज़न मॉडल का उपयोग करता है। यह परिष्कृत कपड़े अर्थ विशेषताओं को निकालने के लिए कपड़े एन्कोडर को डिज़ाइन करके, और स्थानिक-कालिक संगति सुनिश्चित करने के लिए एक हल्के वज़न का मुद्रा एन्कोडर शामिल करके, यथार्थवादी वीडियो ट्राई-ऑन प्रभाव उत्पन्न करता है। ViViD ने अब तक का सबसे बड़ा, सबसे विविध प्रकार के कपड़ों वाला, और उच्चतम रिज़ॉल्यूशन वाला वीडियो वर्चुअल ट्राई-ऑन डेटासेट एकत्रित किया है।