ドイツの人工知能スタートアップ企業Black Forest Labs(ブラックフォレストラボ)は最近、FLUX ProファインチューニングAPIを発表しました。このAPIを使用すると、わずか5枚のサンプル画像でFLUX Pro AI画像モデルをカスタマイズし、特定のブランドのビジュアルスタイルに合わせることができます。
Black Forest Labsによると、ファインチューニング後もモデルは柔軟性を維持し、ユーザーが提供したコンテンツを新しい画像の作成に統合できます。このシステムは、最大400万ピクセルの高解像度画像を生成できます。
FLUX ProファインチューニングAPIを使用することで、クリエイターは自分の画像とコンセプトを使用してFLUX.1[pro]をカスタマイズし、最終的な結果をより適切に制御できます。ユーザーが提供した画像はFLUX Proモデルのトレーニングに使用され、各ファインチューニング版はユーザーがカスタマイズしたFLUX Proモデルになります。
Black Forest Labsが設計したファインチューニングAPIは、同社の製品シリーズ全体に対応しています。カスタマイズされたモデルは、主力製品であるFLUX.1ProとFLUX1.1Pro Ultraと統合でき、FLUX.1Fill(画像修復用)やFLUX.1Depth(構造制御用)などの専門ツールもサポートしています。
ドイツのメディア企業Burda Verlagは、FLUXファインチューニングAPIを利用して、複数のブランド向けにカスタマイズされた画像モデルを作成しています。例えば、同社のクリエイティブチームは、数分以内に子供向けブランドLissy PONY向けに、ブランド独自のビジュアル要素に合った画像を生成できるようになりました。
技術詳細と可用性
技術的な詳細としては、このAPIはJPG、PNG、WebPファイルを含む一般的な画像フォーマットをサポートしています。ユーザーは1~20枚のトレーニング画像をアップロードでき、各画像の最大解像度は100万ピクセルです。Black Forest Labsによると、最適な効果を得るには、テーマが明確に定義された高品質な画像を少なくとも5枚使用する必要があります。
開発者は、トレーニングモード(キャラクター、製品、スタイル、または汎用)、トレーニングの反復回数(最小100回、デフォルト300回)、学習率など、複数のトレーニングパラメーターを調整できます。出力に関しては、高速な推論速度を得るための高速トレーニングを選択するか、より長い処理時間を選択してより高品質の結果を得ることができます。
ユーザー調査では、回答者の68.9%がFLUX Proファインチューニングの結果を、他の既存のファインチューニングサービスよりも好んでいました。
さまざまな使用シナリオに合わせて、Black Forest Labsは具体的な推奨事項を発表しています。例えば、キャラクターモデルをトレーニングする際には、一度に1つのキャラクターしか表示されない画像を使用することをお勧めします。一方、スタイル転送作業では、より高いファインチューニング強度をテストすることで、通常はより良い結果が得られます。
現在、FLUX ProファインチューニングAPIはテスト段階にあり、アクセスにはAPIキーが必要です。Black Forest Labsは、価格の詳細やサービスがいつ全面的に公開されるかについてはまだ発表していません。
公式ブログ:https://blackforestlabs.ai/announcing-the-flux-pro-finetuning-api/
API入口:https://docs.bfl.ml/
要点:
🌟 Black Forest Labsが新しいAPIを発表。ユーザーは5枚のサンプル画像でFLUX Pro AIモデルをカスタマイズできます。
📸 このAPIは、AI画像ジェネレーターがブランドのビジュアルスタイルに合わせる上での限界を解消します。
🖼️ ドイツのメディア企業Burda Verlagは、このAPIを使用して、特定のスタイルに合った画像をブランド向けに迅速に生成しています。