バイトダンスがこっそりと、InfiniteYou(InfU)という名前の画像生成ツールをリリースしました。

簡単に言うと、これはテキストから画像を生成するモデルで、あなたの入力した文章に基づいて、あなた自身の個人特徴を持った高品質な画像を生成できる点が優れています。

QQ_1742541024681.png

単なる顔交換アプリとは違います。シーンや内容を柔軟に変更しながらも、あなたの個人特徴を正確に維持することに重点を置いています。宇宙服を着て宇宙を散歩したり、時代劇の衣装を着て過去にタイムスリップした自分の写真が簡単に生成でき、しかも顔はあなた自身という、とてもクールなツールです。

InfiniteYou」がこれを実現できるのは、高度な技術の組み合わせによるものです。

  • 中核技術: InfuseNet。「InfiniteYou」の中核は、InfuseNetという秘密兵器です。これは、あなたの個人特徴を、Diffusion Transformer(DiT)と呼ばれる高度な画像生成モデル(例えばFLUX)に巧みに注入することができます。InfuseNetは熟練のメイクアップアーティストのようなもので、「残差接続」という精密な操作を通じて、顔の類似性を高めながら、元の生成能力を損なうことはありません。
  • 多段階トレーニング: 精密な調整。「InfiniteYou」は一朝一夕に完成したわけではなく、事前トレーニングと、合成された単一人物多サンプル(SPMS)データを用いた教師あり微調整(SFT)など、複数の段階を経て開発されました。この精密なトレーニング戦略により、テキストと画像の一致度が大幅に向上し、生成された画像があなたの文章記述により忠実に再現され、同時に画像の品質と美しさも向上し、「顔交換」後に起こりがちな不自然な顔の貼り付け問題を効果的に軽減できます。
  • モデルの「ダブル保険」: それぞれの特性。バイトダンスは今回、aes_stage2sim_stage1の2つのモデルバージョンも親切にリリースしました。aes_stage2は第2段階で微調整されたモデルで、デフォルトではより優れたテキストと画像の一致度と美しさを備えています。顔の類似度を重視する場合は、sim_stage1を選択できます。これは携帯電話の購入に似ていて、一つは写真撮影機能に重点を置き、もう一つは性能に重点を置くといった具合で、あなたのニーズに合ったモデルが必ず見つかります。

比較実験から、「InfiniteYou」は人物の類似性、テキストと画像の一致度、画像の品質と美しさなどの点で、FLUX.1-dev IP-AdapterやPuLID-FLUXなどの既存の高度な手法を凌駕していることが分かります。それらの手法は、顔の類似性が低い、文章記述と画像の内容が一致しない、画像の品質が悪い、あるいは「顔交換」後の顔の特徴が不自然に貼り付けられているなどの問題がありました。「InfiniteYou」はそれらに比べて、より包括的で優れたパフォーマンスを発揮します。

さらに驚くべきことに、「InfiniteYou」は「プラグアンドプレイ」機能も備えています。FLUX.1-devの様々なバリエーション(例えば、より効率的なFLUX.1-schnell)、ControlNets、LoRAsなどの既存ツールとシームレスに統合でき、より強力な制御性とカスタマイズ性を提供します。IP-Adapterと組み合わせることで、個性的な画像のスタイル転送も実現できます。このような強力な互換性は、より広範なコミュニティに貴重な貢献をするでしょう。

注意すべき点として、「InfiniteYou」は現在、Creative Commons Attribution-NonCommercial 4.0 International Public Licenseに基づいて公開されており、学術研究目的でのみ使用できます。関連モデル(InsightFaceの顔モデル、FLUX.1-dev基本モデル、LoRAなど)のダウンロードと使用は、元のライセンスを遵守する必要があります。また、開発者はユーザーが地域の法律・規制を遵守し、この技術を責任ある方法で使用し、潜在的な悪用を避けることを期待しています。

プロジェクト入口:https://top.aibase.com/tool/infiniteyou