StructLDM est un modèle de diffusion latente structuré conçu pour apprendre la génération de corps humains 3D à partir d'images 2D. Il est capable de générer des corps humains variés et cohérents en termes de perspective, et supporte différents niveaux de génération et d'édition contrôlées, tels que la génération combinatoire et l'édition de vêtements locale. Le modèle réalise une génération et une édition indépendantes du type de vêtement sans nécessiter de conditions de type de vêtement ou de masque. Ce projet a été proposé par Tao Hu, Fangzhou Hong et Ziwei Liu du S-Lab de l'Université Technologique de Nanyang, et l'article correspondant a été publié à ECCV 2024.