ConsiStory

事前学習済みのテキストツーイメージモデルにおいて、一貫性のある主題を生成するための、訓練不要な手法

一般製品画像画像生成一貫性

ConsiStoryは、事前学習済みのテキストツーイメージモデルにおいて、一貫性のある主題を生成する、訓練不要な手法です。微調整やパーソナライゼーションを必要とせず、従来最先端手法と比べて20倍高速です。主題駆動型の共有アテンションモジュールと対応関係に基づく特徴量注入を導入することで、画像間の主題の一貫性を向上させました。さらに、主題の一貫性を維持しつつレイアウトの多様性を促進する戦略を開発しました。ConsiStoryは、多主題シーンにも自然に拡張でき、一般的なオブジェクトに対する訓練不要なパーソナライゼーションも実現可能です。

Best AI Websites & Tools

ConsiStory

ConsiStory 代替品

ConsiStory — 事前学習済みのテキストツーイメージモデルにおいて、一貫性のある主題を生成するための、訓練不要な手法

CogView4-6B — CogView4-6Bは、高品質な画像生成に特化した強力なテキストから画像への生成モデルです。

Janus-Pro-7B — Janus-Pro-7Bは、マルチモーダルな理解と生成を統合した、新しい自己回帰フレームワークです。

Janus-Pro-1B — Janus-Pro-1Bは、統一的な多様なモダリティを理解し生成する自己回帰フレームワークです。

Flex.1-alpha — 80億パラメータを持つ、Apache 2.0オープンソースライセンスのテキストから画像を生成する事前学習済みモデルです。

Framesの世界 — Framesは、Runwayが提供する高度な画像生成基盤モデルです。これまでにないレベルのスタイル制御と視覚的忠実度を実現します。

TryOffAnyone — 着用している人物から平面状の布地モデルを生成します。

BooW-VTON — 屋外でのバーチャル試着効果を向上させるモデルトレーニングコードライブラリ

Stable Diffusion 3.5 Large用ControlNets — Stable Diffusion 3.5 Large向けの3種類のControlNetsモデル

OminiControl — FLUX.1向けの最小かつ汎用的なコントローラー

Qwen2vl-Flux — テキストプロンプトと視覚的参照を組み合わせて高品質な画像を生成する、高度なマルチモーダル画像生成モデルです。

FLUX.1-dev LoRA Outfit Generator — テキストから衣服画像を生成するAIモデル

IC-Light V2 — FluxベースのIC-Lightモデル。画像の細部を維持しつつ、スタイリッシュな処理に特化しています。

sd3.5 — 高品質な画像生成のための軽量推理モデル

Stable Diffusion 3.5 — 高性能画像生成モデル

RealAnime — Stable DiffusionベースのLoRAモデルで、リアルなアニメスタイルの画像を生成します。

CogView3-Plus-3B — 高解像度画像生成に対応したテキスト画像生成モデル

Omni-Zero-Couples — ゼロショットスタイル化カップル肖像画生成

Open-MAGVIT2 — オープンソースの自己回帰型画像生成モデルプロジェクト

DeepMind — Google傘下の、最先端の人工知能研究企業

GenWarp — 新しい視点の画像を生成し、意味情報を維持します。

DiffusionKit — Appleシリコン上で拡散モデルの推論を実行するツールです。

AuraFlow v0.3 — オープンソースのテキストツーイメージ生成モデル

x-flux — 深層学習モデル訓練スクリプト集

SD3-ControlNet-Canny — 画像生成のための深層学習モデルです。

SDXL Flash — 高効率なテキストから画像生成モデル

StoryDiffusion — StoryDiffusionは、一貫性のある画像と動画を生成することで魔法のような物語を生み出せるツールです。

FaceChain — あなたのデジタルツインを生成するための深層学習ツールチェーン。

生成AIコース — AI学習プラットフォーム

ControlNet++ — テキスト・トゥ・イメージ生成のコントロール性を向上