この度、ブラックフォレストラボは、基盤となるテキストツーイメージモデルFLUX.1の制御性と操作性を向上させることを目的とした、全く新しいツールキットFLUX.1Toolsを発表しました。これにより、ユーザーは実画像と生成画像を正確に修正および再創作できるようになります。
FLUX.1Toolsの主な機能は4つです。
FLUX.1Fill:これは高度な画像修復および拡張ツールであり、Ideogram2.0やオープンソースのAlimamaCreative’s FLUX-Controlnet-Inpaintingなどの既存ツールを凌駕する機能を備えています。FLUX.1Fillは、ユーザーが提供するテキストの説明とバイナリマスクに基づいて、実画像と生成画像を編集および拡張し、変更内容を画像にシームレスに統合して、自然で滑らかな効果を実現します。
テストの結果、FLUX.1Fill [pro]は他のすべての競合製品よりも優れた性能を示し、現在最も高度な画像修復モデルとなっています。オープンソース版のFLUX.1Fill [dev]も、他の独自ソリューションを上回る性能と、より高い推論効率を実現しています。
FLUX.1DepthとFLUX.1Canny:これらのツールはどちらも、画像の構造情報を活用して画像生成をガイドすることで、画像のテクスチャを変更する際に元の構造を維持します。
FLUX.1Depthは画像の深度情報を使用して変更を行い、FLUX.1Cannyはエッジ検出情報を使用してガイドし、正確な詳細調整に適しています。
評価の結果、FLUX.1Depthの性能はMidjourney ReTextureなどの独自モデルを上回っており、FLUX.1Depth [pro]はより高い出力の多様性を提供し、FLUX.1Depth [dev]は深度認識タスクにおいてより一貫した結果を提供します。エッジ検出モデルでは、FLUX.1Canny [pro]の性能が最も高く、次にFLUX.1Canny [dev]が続きます。
FLUX.1Redux:これは、すべてのFLUX.1基本モデルに適用できるアダプターであり、画像のバリエーションを生成するために使用されます。入力画像が与えられると、FLUX.1Reduxはわずかな変更を加えて異なるバージョンを生成したり、ユーザーが提供するテキストの説明に基づいて画像スタイルを再設計したりすることもできます。
さらに、FLUX.1ReduxはAPIを使用して画像スタイルを調整することもできます。ユーザーは画像とテキストの説明を提供するだけで済みます。この機能は最新のFLUX1.1[pro] Ultraモデルに統合されており、このモデルは入力画像とテキストプロンプトを組み合わせて、高品質の400万ピクセルの出力を生成し、柔軟なアスペクト比をサポートします。テストの結果、FLUX.1Reduxは画像バリエーション生成において最先端の性能を達成しました。
FLUX.1Toolsはオープンソース版とAPI版を提供
FLUX.1Toolsは、オープンソース版(FLUX.1[dev])とAPI版(FLUX.1[pro])の2つのバージョンで提供されます。各ツールのAPIバージョンはFLUX.1[pro]のバリアントとしてリリースされ、オープンソースバージョンは指導蒸留されたFLUX.1[dev]のバリアントとしてリリースされ、推論コードと重みが提供されます。さらに、ブラックフォレストラボは、リリースされたモデルをパートナーであるfal.ai、Replicate、Together.ai、Freepik、およびkrea.aiを通じて提供すると発表しました。
ブラックフォレストラボは、今回発表されたFLUX.1ToolsツールキットがFluxエコシステムに新たな活力を注入すると述べており、コミュニティユーザーがこれらの新しいツールを使用してさらに素晴らしい作品を生み出すことを期待しています。
モデル:https://huggingface.co/black-forest-labs/FLUX.1-Redux-dev