StructLDMは、2D画像から3D人体生成を学習する構造化潜在拡散モデルです。多様な視点で一貫性のある人体を生成し、組み合わせ生成や局所的な服装編集など、様々なレベルの制御可能な生成と編集をサポートします。服装の種類やマスク条件を必要とせず、服装に依存しない生成と編集を実現しています。このモデルは、南洋理工大学S-LabのTao Hu、Fangzhou Hong、Ziwei Liuによって提案され、ECCV 2024で論文発表されました。