HelloMeme
空間織り込み注意力機構を統合し、拡散モデルの高忠実度条件生成を向上
一般製品画像画像生成動画生成
HelloMemeは、空間織り込み注意力機構を統合した拡散モデルであり、高忠実度で豊富な条件を画像生成プロセスに組み込むことを目指しています。この技術は、駆動ビデオの各フレームの特徴を抽出し、それをHMControlModuleへの入力として使用することで、ビデオを生成します。さらにAnimatediffモジュールを最適化することで、生成されるビデオの連続性と忠実度を向上させています。さらに、HelloMemeはARKitによる顔のブレンドシェイプを用いた顔表情の制御、SD1.5ベースのLoraまたはCheckpointによるフレームのホットスワップアダプターをサポートしており、T2Iモデルの汎化能力に影響を与えることはありません。