この度、Googleは最新の画像生成モデル「Imagen3」を正式にリリースし、Gemini APIで開発者向けに提供開始しました。このモデルは、超現実主義の作品、印象派の風景画、抽象画、アニメキャラクターなど、様々なスタイルの高品質な画像を生成できる優れた視覚効果を備えています。Imagen3は、画像の解像度と構図能力を向上させただけでなく、簡素化されたテキストプロンプトにより、ユーザーがアイデアを画像に変換する作業を容易にしました。
当初、Imagen3は有料ユーザーのみに開放されますが、近日中に無料ユーザーへの段階的な展開が予定されています。公式の説明によると、ユーザーは画像1枚につき0.03ドルを支払うことで、Imagen3の強力な機能を利用できます。また、画像生成時には、アスペクト比や生成オプション数を自由に制御でき、様々なニーズに対応できます。
虚偽情報や不正な帰属を防ぐため、Imagen3で生成されたすべての画像には、不可視のデジタルウォーターマーク「SynthID」が埋め込まれています。このウォーターマークにより、AI生成作品であることが識別できます。さらに、開発者はPythonコードを使用して簡単に画像を生成でき、具体的なコード例は公式ドキュメントに掲載されています。APIキーを設定し、プロンプトを入力するだけで、簡単に目的の画像を生成し、この新技術の利便性を体験できます。
Imagen3の機能をユーザーがよりよく理解できるように、公式では様々なスタイルとテーマを網羅した生成画像サンプルを公開しています。技術の進歩に伴い、Googleは近い将来、より多くの生成メディアモデルをGemini APIに統合し、生成メディアと言語モデルの連携を促進し、開発者がより多くの魅力的なアプリケーションを作成できるよう支援する予定です。
ブログ:https://developers.googleblog.com/en/imagen-3-arrives-in-the-gemini-api/
要点:
🌟 Imagen3がGemini APIで利用可能になり、様々なスタイルの高品質な画像生成サービスを提供します。
💰 画像1枚あたりの生成費用は0.03ドルで、アスペクト比や生成オプションをユーザーが自由に設定できます。
🔒 生成されたすべての画像には不可視のウォーターマークが埋め込まれており、虚偽情報の拡散を防ぎます。