ConsiStory

事前学習済みのテキストツーイメージモデルにおいて、一貫性のある主題を生成するための、訓練不要な手法

一般製品画像画像生成一貫性
ConsiStoryは、事前学習済みのテキストツーイメージモデルにおいて、一貫性のある主題を生成する、訓練不要な手法です。微調整やパーソナライゼーションを必要とせず、従来最先端手法と比べて20倍高速です。主題駆動型の共有アテンションモジュールと対応関係に基づく特徴量注入を導入することで、画像間の主題の一貫性を向上させました。さらに、主題の一貫性を維持しつつレイアウトの多様性を促進する戦略を開発しました。ConsiStoryは、多主題シーンにも自然に拡張でき、一般的なオブジェクトに対する訓練不要なパーソナライゼーションも実現可能です。
ウェブサイトを開く

ConsiStory 代替品