DALL-E 3の展開と安全対策

OpenAIの新型画像AI、DALL-E 3が現在、ChatGPTとBingイメージクリエイターに展開されています。OpenAIは、ユーザーが潜在的に有害または不快な画像を生成するのを防ぐための取り組みを記録しています。

資料によると、DALL-E 3をChatGPTに統合することは、安全対策と利便性向上策の両方です。これは、ChatGPTが「プロンプト変換」と呼ばれる手法を使用して、ユーザーのプロンプトがコンテンツポリシーに違反する可能性をチェックし、違反が意図的ではないと判断された場合は、違反を回避するように書き直すことができるためです。

境界設定とテストのために、OpenAIはレッドチーム演習にも依存しています。これは、指定された担当者が意図的なプロンプトを通じてDALL-E 3に誤った考えを生じさせようとするものです。性差別やその他の「不快な」コンテンツについては、OpenAIは画像出力分類器を訓練して、画像内の疑わしいパターンを検出し、生成を停止します。リリース版のDALL-E 3では、このような望ましくない画像のリスクが0.7%に低減されています。

著作権の問題に関しては、OpenAIは、すべてのリスク軽減策を講じているものの、考えられるすべての組み合わせを予測することは不可能であるため、一部の一般的なアイテムはブランドや商標コンテンツと強く関連している可能性があり、リアルなシーンのレンダリングの一部として生成される可能性があると認めています。