このチュートリアルは、これまでに学習した内容をすべて統合したものです。総合的なケーススタディとして、復習や理解を深めるのに最適です。

これまでのチュートリアルをご覧になっていない方は、站長素材AI教程ウェブサイトをご覧ください。

ウェブサイトリンク:https://aisc.chinaz.com/jiaocheng/

_x0000_i1026

このワークフローでは、ComfyUIを使用して写真をレトロアニメスタイルの画像に変換します。以下は、このワークフローの各ノードとその機能の詳細な説明です。

ノード解説

1.画像の読み込みと前処理:

LoadImage (id: 13):指定されたURLから入力画像を読み込みます。

DF_Get_image_size (id: 15):読み込んだ画像の幅と高さを取得します。

EmptyLatentImage (id: 5):抽出された次元の空の潜在画像を作成します。

2.ControlNetローダーと前処理:

ControlNetLoader (id: 28):線画用のControlNetモデル (control_v11p_sd15_lineart.pth) を読み込みます。

ControlNetLoader (id: 30):ポーズ検出用のControlNetモデル (control_v11p_sd15_openpose.pth) を読み込みます。

ControlNetLoader (id: 27):深度検出用のControlNetモデル (control_v11f1p_sd15_depth.pth) を読み込みます。

Zoe_DepthAnythingPreprocessor (id: 40):深度情報を生成するために画像を処理します。

Inference_Core_LineArtPreprocessor (id: 42):線画情報を生成するために画像を処理します。

OpenposePreprocessor (id: 39):ポーズのキーポイントを生成するために画像を処理します。

3.条件の適用と組み合わせ:

ControlNetApply (id: 26、29、31):深度、線画、ポーズ情報を組み合わせて、ControlNet条件を画像に適用します。

ConditioningCombine (id: 37):異なる条件情報を組み合わせます。

4.テキストエンコーディング:

CLIPTextEncode (id: 6):肯定的な記述テキストをエンコードします(例:「beautiful scenery nature glass bottle landscape, purple galaxy bottle」)。

CLIPTextEncode (id: 7):否定的な記述テキストをエンコードします(例:「Easy Negative, worst quality, low quality」など)。

CLIPTextEncode (id: 34):追加の記述テキストをエンコードします(例:「official art, context art, retro anime, complex background, blurry background, depth of field」)。

5.モデルの読み込みとサンプリング:

CheckpointLoaderSimple (id: 4):メインの生成モデル (AWPainting(1.4)) を読み込みます。

LoraLoader (id: 10、16):特定のスタイル調整のためのLoraモデルを読み込みます(例:「80'sFusion(V2.0)」と「Retro Anime(1.0)」)。

KSampler (id: 3):KSamplerを使用して、モデル、肯定的および否定的な条件、潜在画像を組み合わせて潜在画像をサンプリングします。

VAEDecode (id: 8):サンプリングされた潜在画像を最終的な画像にデコードします。

6.画像の保存:

SaveImage (id: 9):生成された画像を保存します。

使用方法

ComfyUIのワークフローは複製が容易なため、ここではワークフローを直接提供し、重要な点を説明することでロジックを整理するお手伝いをします。このワークフローが必要な方は、下のQRコードをスキャンしてグループに参加して入手してください。不明な点があれば、グループで質問することもできます。

image.png

初めてワークフローを使用する際に、欠落しているノードのインストールを促すエラーが表示される場合があります。マネージャーで欠落しているノードをインストールすれば問題ありません。

image.png

Loraの読み込み

大規模モデルに2つのLoraを接続します。

image.png

逆引きタグ

WD14逆引きプロンプトがない方は、マネージャーでWDを検索してインストールしてください。CLIPテキストエンコーディングは、テキスト入力に変更してWDから逆引きされたキーワードと接続する必要があります。

image.png

ControlNet制御

ここでは、深度マップ、線画、ポーズ制御の3つのControlNetを接続して使用します。

image.png

画像の幅と高さの取得

image.png

プロンプトの結合

Loraモデルにはいくつかのトリガーワードが必要ですが、以前のテキストエンコーダーはすでにWDに接続されているため、テキストエンコーダーを複製し、WDプロンプトのテキストエンコーダーと結合するしかありません。最後に、結合された条件を最初のControlNetアプリケーションに接続します。

image.png

ワークフローの効果

image.png

image.png

このワークフローの主な手順は、画像を読み込んで前処理し、さまざまなControlNetモデルを使用して補助情報(深度、線画、ポーズなど)を生成し、これらの情報とテキストの説明を組み合わせて画像を生成し、最終的にレトロアニメスタイルの画像をデコードして保存することです。このワークフローが必要な方は、下のQRコードをスキャンしてグループに参加して入手してください。

------------------------------------------------------------------------------------------

站長素材AI教程は、站長之家が運営するAIイラストチュートリアルプラットフォームです。

大量の無料AIチュートリアルを提供しており、継続的に有益なコンテンツを更新しています。

より多くのAIイラストチュートリアルを深く学びたい方は、站長素材AI教程ウェブサイトをご覧ください:

https://aisc.chinaz.com/jiaocheng/