LayerDiffusionは、大規模事前学習済み潜在拡散モデルによる透明画像の生成を可能にする手法です。この手法では、単一の透明画像または複数の透明レイヤーを生成できます。潜在空間へのアルファチャンネルの透明度エンコーディングを行う「潜在透明度」を学習します。追加された透明度を潜在オフセットとして調整することで、事前学習済みモデルの元の潜在分布を最小限に変更し、大規模拡散モデルの生産就労品質を維持します。潜在空間の調整による微調整により、任意の潜在拡散モデルを透明画像ジェネレーターに変換できます。100万枚の人工協調で収集された透明画像レイヤーペアを用いてモデルを学習しました。潜在透明度は、様々なオープンソース画像ジェネレーターに適用したり、様々な条件制御システムに適合させることができ、前景/背景条件レイヤー生成、結合レイヤー生成、レイヤーコンテンツ構造制御などの用途を実現します。ユーザー調査によると、ほとんどの場合(97%)、ユーザーは、生成後に切り抜くといった従来の一時的な解決策ではなく、当システムで生成された透明コンテンツを好んでいます。また、生成された透明画像の品質は、Adobe Stockなどの商用透明アセットと匹敵すると評価されています。