このチュートリアルは、これまでに学習した内容をすべて統合したものです。総合的なケーススタディとして、復習や理解を深めるのに最適です。
これまでのチュートリアルをご覧になっていない方は、站長素材AI教程ウェブサイトをご覧ください。
ウェブサイトリンク:https://aisc.chinaz.com/jiaocheng/
このワークフローでは、ComfyUIを使用して写真をレトロアニメスタイルの画像に変換します。以下は、このワークフローの各ノードとその機能の詳細な説明です。
ノード解説
1.画像の読み込みと前処理:
LoadImage (id: 13):指定されたURLから入力画像を読み込みます。
DF_Get_image_size (id: 15):読み込んだ画像の幅と高さを取得します。
EmptyLatentImage (id: 5):抽出された次元の空の潜在画像を作成します。
2.ControlNetローダーと前処理:
ControlNetLoader (id: 28):線画用のControlNetモデル (control_v11p_sd15_lineart.pth) を読み込みます。
ControlNetLoader (id: 30):ポーズ検出用のControlNetモデル (control_v11p_sd15_openpose.pth) を読み込みます。
ControlNetLoader (id: 27):深度検出用のControlNetモデル (control_v11f1p_sd15_depth.pth) を読み込みます。
Zoe_DepthAnythingPreprocessor (id: 40):深度情報を生成するために画像を処理します。
Inference_Core_LineArtPreprocessor (id: 42):線画情報を生成するために画像を処理します。
OpenposePreprocessor (id: 39):ポーズのキーポイントを生成するために画像を処理します。
3.条件の適用と組み合わせ:
ControlNetApply (id: 26、29、31):深度、線画、ポーズ情報を組み合わせて、ControlNet条件を画像に適用します。
ConditioningCombine (id: 37):異なる条件情報を組み合わせます。
4.テキストエンコーディング:
CLIPTextEncode (id: 6):肯定的な記述テキストをエンコードします(例:「beautiful scenery nature glass bottle landscape, purple galaxy bottle」)。
CLIPTextEncode (id: 7):否定的な記述テキストをエンコードします(例:「Easy Negative, worst quality, low quality」など)。
CLIPTextEncode (id: 34):追加の記述テキストをエンコードします(例:「official art, context art, retro anime, complex background, blurry background, depth of field」)。
5.モデルの読み込みとサンプリング:
CheckpointLoaderSimple (id: 4):メインの生成モデル (AWPainting(1.4)) を読み込みます。
LoraLoader (id: 10、16):特定のスタイル調整のためのLoraモデルを読み込みます(例:「80'sFusion(V2.0)」と「Retro Anime(1.0)」)。
KSampler (id: 3):KSamplerを使用して、モデル、肯定的および否定的な条件、潜在画像を組み合わせて潜在画像をサンプリングします。
VAEDecode (id: 8):サンプリングされた潜在画像を最終的な画像にデコードします。
6.画像の保存:
SaveImage (id: 9):生成された画像を保存します。
使用方法
ComfyUIのワークフローは複製が容易なため、ここではワークフローを直接提供し、重要な点を説明することでロジックを整理するお手伝いをします。このワークフローが必要な方は、下のQRコードをスキャンしてグループに参加して入手してください。不明な点があれば、グループで質問することもできます。
初めてワークフローを使用する際に、欠落しているノードのインストールを促すエラーが表示される場合があります。マネージャーで欠落しているノードをインストールすれば問題ありません。
Loraの読み込み
大規模モデルに2つのLoraを接続します。
逆引きタグ
WD14逆引きプロンプトがない方は、マネージャーでWDを検索してインストールしてください。CLIPテキストエンコーディングは、テキスト入力に変更してWDから逆引きされたキーワードと接続する必要があります。
ControlNet制御
ここでは、深度マップ、線画、ポーズ制御の3つのControlNetを接続して使用します。
画像の幅と高さの取得
プロンプトの結合
Loraモデルにはいくつかのトリガーワードが必要ですが、以前のテキストエンコーダーはすでにWDに接続されているため、テキストエンコーダーを複製し、WDプロンプトのテキストエンコーダーと結合するしかありません。最後に、結合された条件を最初のControlNetアプリケーションに接続します。
ワークフローの効果
このワークフローの主な手順は、画像を読み込んで前処理し、さまざまなControlNetモデルを使用して補助情報(深度、線画、ポーズなど)を生成し、これらの情報とテキストの説明を組み合わせて画像を生成し、最終的にレトロアニメスタイルの画像をデコードして保存することです。このワークフローが必要な方は、下のQRコードをスキャンしてグループに参加して入手してください。
------------------------------------------------------------------------------------------
站長素材AI教程は、站長之家が運営するAIイラストチュートリアルプラットフォームです。
大量の無料AIチュートリアルを提供しており、継続的に有益なコンテンツを更新しています。
より多くのAIイラストチュートリアルを深く学びたい方は、站長素材AI教程ウェブサイトをご覧ください: