SD3.5の軌跡

6月、Stability AIはStable Diffusion 3 Mediumを発表しましたが、FLUXの登場後、SD3は事実上忘れ去られてしまいました。FLUXにあらゆる面で劣り、Stability AIの不公平な条件もSD3の評判を著しく落としました。今回、公式は教訓を活かし、3.5版を開発し、SD3.5を構築者とクリエイターに広くアクセス可能な、最先端で、ほとんどの用途で無料のツールとして提供すると約束しました。

モデルの特徴

数時間前、Stability AIは正式にStable Diffusion 3.5「large」版を発表しました。

今回のアップデートには2つの大きな特徴があります。

① モデルのスタイルの多様性が向上し、ユーザーはプロンプトを変更することで、より多くの画像スタイルを取得できます。

② 画像生成のAI的な質感は低減され、光と影、素材においてより自然になり、生成された画像がよりリアルになりました。

今回Stability AIは、Large版とLarge Turbo版の2つのバージョンを発表しました。

公式によると、Medium版は10月29日にリリースされる予定です。

現在の2つのバージョンの概要は以下の通りです。

  • Stable Diffusion 3.5 Large: 80億個のパラメータを持つ基本モデルで、卓越した品質と迅速な応答性を備え、Stable Diffusionシリーズの中で最も強力です。このモデルは1MP解像度のプロフェッショナルな用途に最適です。

  • Stable Diffusion 3.5 Large Turbo: Stable Diffusion 3.5 Largeの軽量版で、わずか4ステップで優れた高速性と高品質な画像を生成でき、Stable Diffusion 3.5 Largeよりもはるかに高速です。

下図は公式が提供するモデルの比較です。美しさはFLUX 1 Devに劣りますが、プロンプトへの忠実度は現状最高です。

image.png

そこで、SD3.5の実力をFLUXと比較し、AI画像生成分野の頂点に返り咲けるかどうかを検証してみましょう。

より詳細な情報は公式発表ページをご覧ください: https://stability.ai/news/introducing-stable-diffusion-3-5

オンライン体験

Large オンライン体験版: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large

Turbo オンライン体験版: https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large-turbo

モデルダウンロード

Large ダウンロード: https://huggingface.co/stabilityai/stable-diffusion-3.5-large

Turbo ダウンロード: https://huggingface.co/stabilityai/stable-diffusion-3.5-large-turbo

初回ダウンロードには、連絡先の情報を入力する必要があります。

image.png

モデルの使用

公式が提供するサンプルワークフローとモデルをダウンロードします。モデルはComfyUI\models\checkpointsに配置します。

image.png

ワークフローをComfyUIにドラッグアンドドロップします。ノードが不足している場合は、不足しているノードをインストールします。以前SD3を使用していた方は、これらのノードは既にインストールされているはずです。

image.png

3つのCLIPモデルをロードする必要があります。持っていない方は、こちらからダウンロードできます: https://huggingface.co/stabilityai/stable-diffusion-3-medium/tree/main/text_encoders

ダウンロードしたら、ComfyUI\models\clipフォルダに配置します。

最高の効果を求める場合は、T5xxlをFP16版に置き換えることができます。

image.png

出力結果

SD3.5の出力は非常にメモリを消費します。4090 24GBのメモリでも簡単にメモリ不足になります。通常、1024×1024の画像を生成するのに約40秒かかります。

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

まとめ

上の図の比較から、それぞれ長所と短所があることが分かります。

SD3.5では、人物の手の部分にまだ問題があります。開発チームもこれらの問題を認識している可能性があり、FLUXよりも隠蔽されている可能性があります。

長所としては、SD3.5の出力がより写実的な場合があります。FLUXは肌の描写が油っぽい傾向がありますが、SD3.5はより繊細でリアルです。

長文とプロンプトへの忠実度については、どちらもほぼ同じです。

美しさに関しては、SD3.5の方が優れている場合があります。

パフォーマンス面では、SD3.5はFLUXに劣り、FLUXよりも生成時間が長く、メモリ消費量も大きいです。

しかし、現状FLUXのエコシステムの方が充実しているので、短期的にはSD3.5がFLUXを凌駕することは難しいでしょう。

------------------------------------------------------------------------------------------

站長素材AI教程は站長之家傘下のAI画像生成チュートリアルプラットフォームです。

豊富なAI無料チュートリアルを継続的に更新しています。

AI画像生成チュートリアルをさらに深く学びたい方は、站長素材AI教程サイトをご覧ください。

https://aisc.chinaz.com/jiaocheng/