ComfyUIワークフロー解析：写真からレトロなアバターを作成

站长素材

公開日AIニュース · 3 分で読めます · Jul 18, 2024

246

このチュートリアルは、これまでに学習した内容をすべて統合したものです。総合的なケーススタディとして、復習や理解を深めるのに最適です。

これまでのチュートリアルをご覧になっていない方は、站長素材AI教程ウェブサイトをご覧ください。

ウェブサイトリンク：https://aisc.chinaz.com/jiaocheng/

_x0000_i1026

このワークフローでは、ComfyUIを使用して写真をレトロアニメスタイルの画像に変換します。以下は、このワークフローの各ノードとその機能の詳細な説明です。

ノード解説

1.画像の読み込みと前処理：

LoadImage (id: 13)：指定されたURLから入力画像を読み込みます。

DF_Get_image_size (id: 15)：読み込んだ画像の幅と高さを取得します。

EmptyLatentImage (id: 5)：抽出された次元の空の潜在画像を作成します。

2.ControlNetローダーと前処理：

ControlNetLoader (id: 28)：線画用のControlNetモデル (control_v11p_sd15_lineart.pth) を読み込みます。

ControlNetLoader (id: 30)：ポーズ検出用のControlNetモデル (control_v11p_sd15_openpose.pth) を読み込みます。

ControlNetLoader (id: 27)：深度検出用のControlNetモデル (control_v11f1p_sd15_depth.pth) を読み込みます。

Zoe_DepthAnythingPreprocessor (id: 40)：深度情報を生成するために画像を処理します。

Inference_Core_LineArtPreprocessor (id: 42)：線画情報を生成するために画像を処理します。

OpenposePreprocessor (id: 39)：ポーズのキーポイントを生成するために画像を処理します。

3.条件の適用と組み合わせ：

ControlNetApply (id: 26、29、31)：深度、線画、ポーズ情報を組み合わせて、ControlNet条件を画像に適用します。

ConditioningCombine (id: 37)：異なる条件情報を組み合わせます。

4.テキストエンコーディング：

CLIPTextEncode (id: 6)：肯定的な記述テキストをエンコードします（例：「beautiful scenery nature glass bottle landscape， purple galaxy bottle」）。

CLIPTextEncode (id: 7)：否定的な記述テキストをエンコードします（例：「Easy Negative， worst quality， low quality」など）。

CLIPTextEncode (id: 34)：追加の記述テキストをエンコードします（例：「official art， context art， retro anime， complex background， blurry background， depth of field」）。

5.モデルの読み込みとサンプリング：

CheckpointLoaderSimple (id: 4)：メインの生成モデル (AWPainting(1.4)) を読み込みます。

LoraLoader (id: 10、16)：特定のスタイル調整のためのLoraモデルを読み込みます（例：「80'sFusion(V2.0)」と「Retro Anime(1.0)」）。

KSampler (id: 3)：KSamplerを使用して、モデル、肯定的および否定的な条件、潜在画像を組み合わせて潜在画像をサンプリングします。

VAEDecode (id: 8)：サンプリングされた潜在画像を最終的な画像にデコードします。

6.画像の保存：

SaveImage (id: 9)：生成された画像を保存します。

使用方法

ComfyUIのワークフローは複製が容易なため、ここではワークフローを直接提供し、重要な点を説明することでロジックを整理するお手伝いをします。このワークフローが必要な方は、下のQRコードをスキャンしてグループに参加して入手してください。不明な点があれば、グループで質問することもできます。

初めてワークフローを使用する際に、欠落しているノードのインストールを促すエラーが表示される場合があります。マネージャーで欠落しているノードをインストールすれば問題ありません。

Loraの読み込み

大規模モデルに2つのLoraを接続します。

逆引きタグ

WD14逆引きプロンプトがない方は、マネージャーでWDを検索してインストールしてください。CLIPテキストエンコーディングは、テキスト入力に変更してWDから逆引きされたキーワードと接続する必要があります。

ControlNet制御

ここでは、深度マップ、線画、ポーズ制御の3つのControlNetを接続して使用します。

画像の幅と高さの取得

プロンプトの結合

Loraモデルにはいくつかのトリガーワードが必要ですが、以前のテキストエンコーダーはすでにWDに接続されているため、テキストエンコーダーを複製し、WDプロンプトのテキストエンコーダーと結合するしかありません。最後に、結合された条件を最初のControlNetアプリケーションに接続します。

ワークフローの効果

このワークフローの主な手順は、画像を読み込んで前処理し、さまざまなControlNetモデルを使用して補助情報（深度、線画、ポーズなど）を生成し、これらの情報とテキストの説明を組み合わせて画像を生成し、最終的にレトロアニメスタイルの画像をデコードして保存することです。このワークフローが必要な方は、下のQRコードをスキャンしてグループに参加して入手してください。

------------------------------------------------------------------------------------------

站長素材AI教程は、站長之家が運営するAIイラストチュートリアルプラットフォームです。

大量の無料AIチュートリアルを提供しており、継続的に有益なコンテンツを更新しています。

より多くのAIイラストチュートリアルを深く学びたい方は、站長素材AI教程ウェブサイトをご覧ください：

https://aisc.chinaz.com/jiaocheng/

ComfyUI ComfyUIワークフロー AI会員向けチュートリアル

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

OstrisがFlex.2-preview 8億パラメーター拡散モデルを発表、ComfyUIワークフローを革新

Ostrisチームは、ComfyUIワークフローへの統合を目的とした、8億パラメーターのテキストツーイメージ拡散モデルであるFlex.2-previewを発表しました。AIbaseによると、このモデルは、線、ポーズ、深さに関する制御された生成能力に優れており、汎用的な制御と画像修復機能をサポートしています。Flux.1SchnellからOpenFlux.1、Flex.1-alphaまでの微調整進化の道を継承しています。Flex.2-previewはHu…

Apr 24, 2025

ノードの悪夢に別れを告げる！ComfyUI-C opilotリリース GPT-4o同等の画像生成と編集能力を搭載

最近、ComfyUI-C opilotという革新的なツールが、人工知能によるコンテンツ生成分野で大きな注目を集めています。このツールは、自然言語処理とComfyUIのノード式ワークフローを組み合わせることで、ユーザーにGPT-4oのような画像生成と編集能力を提供します。その登場は、利用障壁を大幅に下げるだけでなく、初心者とプロユーザーの両方に効率的でインテリジェントな創作プラットフォームを提供し、AI画像生成技術がより人間的で自動化された方向へ大きく前進したことを示しています。

Mar 31, 2025

320

AIデイリーニュース：OpenAIが月額200ドルのChatGPT Proを発表；京東が10種類のAIマーケティングツールを発表；ComfyUIプラグインにマイニングウイルス感染

【AIデイリーニュース】へようこそ！ここでは、AIの世界を探求するための毎日のガイドとして、AI分野のホットな話題を毎日お届けします。開発者に焦点を当て、技術トレンドの把握、革新的なAI製品の応用への理解を支援します。新しいAI製品については、こちらをご覧ください:https://top.aibase.com/1、GoogleがPaliGemma2を発表：AIは感情を理解できるか？専門家は科学性と倫理的リスクに疑問を呈すGoogleが発表したPaliGemma2 AIモデルは、画像分析を通じて人間の感情を識別できると主張しているが…

Dec 6, 2024

850

ComfyUIプラグインImpact-Packに重大なセキュリティ脆弱性：仮想通貨マイニングウイルスが埋め込まれる

最近、ComfyUIコミュニティで人気のあるプラグインImpact-Packに深刻なセキュリティ脆弱性が発見されました。これにより、依存関係にあるUltralyticsパッケージ（バージョン8.3.41と8.3.42）にハッカーが仮想通貨マイニングウイルスを埋め込んだことが判明しました。Impact-Packはほぼすべてのユーザーがインストールするプラグインであるため、多くの人が影響を受けている可能性があります。ウイルスは改ざんされたUltralyticsパッケージを通じて悪意のあるプログラムを自動的にダウンロードして実行し、疑わしいマイニングプールに接続します。

Dec 6, 2024

8.0k

AI日報：阿里、推理モデルQwQ-32B-Previewを発表；360、新たなAI検索製品「ナノ検索」発表；バイトダンス、攻撃モデル訓練インターンを訴え800万元請求；ComfyUIデスクトップ版リリース

【AI日報】へようこそ！AIの世界を探求するための毎日のガイドです。毎日、AI分野のホットなトピックをご紹介し、開発者に焦点を当て、技術トレンドの把握、革新的なAI製品アプリケーションの理解を支援します。最新のAI製品はこちらをご覧ください：https://top.aibase.com/1、360がマルチモーダルコンテンツ制作エンジン「ナノ検索」を発表　360は発表会で、あらゆる年齢層のユーザーにとって使いやすく、革新的なマルチモーダルコンテンツ制作エンジンである「ナノ検索」を発表しました。

Nov 28, 2024

530

ComfyUIの大型アップデート：デスクトップ版正式リリース、初心者でもAIイラスト作成が簡単に！

オープンソースのAIイラストツールComfyUIが、ついに公式デスクトップ版をリリース！WindowsとMacに対応したこのデスクトップ版は、完全にオープンソースであるだけでなく、初心者ユーザー向けに詳細な操作ガイドも提供されており、AIイラスト作成が技術者だけの専売特許ではなくなりました。複雑な設定はもう不要です。ComfyUIデスクトップ版は、より便利でスムーズなユーザーエクスペリエンスを提供します。推奨Python環境が統合され、最新バージョンに自動更新され、既存のComfy...

Nov 28, 2024

10.1k

Lightricksがリアルタイム動画生成モデルLTX-Videoをオープンソース化！わずか4秒で動画生成！

Lightricks社は最近、画期的なオープンソースの動画生成モデルであるLTX Video（略称：LTXV）を発表しました。この拡散トランスフォーマー（DiT）アーキテクチャに基づくモデルは20億個のパラメータを持ち、公開初日にComfyUIとのネイティブ統合を実現し、業界に大きな反響を呼びました。この画期的な動画生成モデルは、驚くべきパフォーマンスを発揮します。毎秒24フレームで768×512ピクセルの解像度の動画コンテンツを生成でき、動画再生よりも速い生成速度を実現しています。

Nov 25, 2024

8.0k

次元壁崩壊？ComfyUI Object Migrationはワンクリック衣装変更だけでなく、実写も3Dモデルに瞬時変換

好きなアニメキャラの衣装を現実世界に着せ替えたいと思ったことはありませんか？あるいは、デザインした衣装をモデルに直接「着せ」、面倒な制作工程を省きたいと思ったことはありませんか？今なら、それが実現可能です！「ComfyUI Object Migration」と呼ばれる衣装変更モデルとワークフローが登場し、衣装スタイルの移行を簡単に実現できるだけでなく、3Dモデルの生成も可能です。まさにデザイナーと二次元愛好家にとって朗報です！この技術の核心機能は「ワンクリック衣装変更」です。想像を…

Nov 21, 2024

4.4k

AI日報：ClaudeがPDFファイル処理機能を追加；Runwayが高度なカメラ制御をリリース；動画から動画への変換をサポートするオープンソースツールComfyUI-MochiEdit

【AI日報】へようこそ！ここでは、人工知能の世界を探求するための毎日のガイドとして、AI分野のホットな話題を毎日お届けします。開発者をフォーカスし、技術トレンドの洞察や革新的なAI製品の応用を理解するお手伝いをします。最新のAI製品はこちらをご覧ください：https://top.aibase.com/1、Claude3.5SonnetモデルがPDFファイル処理機能を追加Anthropic社が最近リリースしたClaude3.5Sonnetモデルは、PDFファイル処理機能を追加しました

Nov 4, 2024

460

動画編集の常識を覆す！オープンソースツールComfyUI-MochiEditで動画→動画変換と部分編集が可能に

まるでテキストを編集するように動画を編集したいと思ったことはありませんか？今、それが現実のものとなりました！ComfyUI-MochiEditは、ComfyUIとGenmo Mochiをベースとしたオープンソースの動画編集ツールで、動画をノイズに変換し、プロンプトを使ってノイズを再サンプリングすることで新しい動画を生成するという、全く新しい動画編集の概念を提供します。この方法の利点は、部分編集と動画→動画変換機能を実現できることです。つまり、あなたは…

Nov 4, 2024

3.8k

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要