先日、Googleのテキストから画像を生成するモデルImagen3「ImageFX」が全ユーザー向けに正式公開されました。他のテキスト生成モデルとは異なり、ImageFXはより優れたプロンプト(指示文)操作体験を提供します。
ImageFXのウェブサイトにログインして、説明文を入力するだけで、システムが対応する画像を生成します。
この過程で、Imagen3はプロンプトを非常に的確に理解し、元のプロンプトを基に最適化し、より多くの選択肢を提供することで、生成効果を高めます。
例えば、AIbaseのテストでは、「The ever-cute cat crouches next to the balcony in the living room, next to a potted green cactus」というプロンプトが使用されました。
生成をクリックすると、ImageFXはプロンプトの順番を自動的に調整し、元のプロンプトのシーンや形容詞からさらに多くの選択肢を導き出します。「cute」という形容詞には、「ugly/mean/scary」などの選択肢が追加され、ユーザーは様々な効果を簡単に生成できます。このプロンプト操作体験は非常に優れています。
Imagen3は、非常に便利な部分修正機能も提供しています。ブラシツールで変更したい部分を塗りつぶし、関連する説明文を入力すると、システムが自動的に修正後の画像を生成します。
例えば、サボテンの部分を塗りつぶし、「葉のある植物の鉢植え」と説明文を入力すると、サボテンの鉢植えが別の植物に変わります。
つまり、変更したい部分にだけ集中すれば、他の部分はそのまま維持されるため、非常に便利です!