Stable Diffusion 3.5 Largeは、Stability AIが開発した、テキストから画像を生成する多様なモードを持つ拡散変換器(MMDiT)モデルです。画像品質、レイアウト、複雑なプロンプトの理解、リソース効率において大幅な改善が見られます。3つの固定された事前学習済みテキストエンコーダを使用し、QK正規化技術により訓練の安定性を向上させています。さらに、合成データとフィルタリングされた公開利用可能なデータを含むデータと戦略を用いて訓練されています。Stable Diffusion 3.5 Largeモデルは、コミュニティライセンス契約に従い、研究、非営利目的、および年間収入100万米ドル未満の組織や個人の商業利用に無料で利用できます。