MagicClothing ist eine neuartige, auf dem Latent Diffusion Model (LDM) basierende Netzwerkarchitektur, die speziell für die kleidergesteuerte Bildsynthese entwickelt wurde. Sie kann anhand von Textprompts maßgeschneiderte Charakterbilder mit spezifischer Kleidung generieren und gleichzeitig die Details der Kleidung und die Treue zum Textprompt gewährleisten. Durch einen Kleider-Feature-Extraktor und eine Self-Attention-Fusionstechnik wird eine hohe Steuerbarkeit der Bilder erreicht. Das System ist zudem mit anderen Technologien wie ControlNet und IP-Adapter kombinierbar, um die Vielfalt und Steuerbarkeit der Charaktere zu verbessern. Zusätzlich wurde die Matching-Point-LPIPS (MP-LPIPS)-Metrik zur Bewertung der Übereinstimmung der generierten Bilder mit der Originalbekleidung entwickelt.