Stable Diffusion 3(SD3)テクノロジーレポートは、SD3が採用するマルチモーダル拡散トランスフォーマーアーキテクチャMMDiTについて詳細に説明しています。画像とテキスト表現に対して別々の2つの重みセットを使用することで、性能が向上しました。レポートでは、SD3が再重み付けフロー技術を導入したこと、そして将来的な性能向上を見据えた大規模化研究についても明らかにしています。さらに、テキストエンコーダーの問題点と提案についても触れています。全体的に見て、SD3は技術的な革新と性能において深い印象を与えます。
Stable Diffusion 3技術レポートがSoraと同等のアーキテクチャの詳細を明らかに
