谷歌近日宣布,将重新启用其AI聊天机器人Gemini的人物图像生成功能。这一决定来自于今年早些时候因历史不准确报道而暂停的争议性功能。根据谷歌的声明,该功能的早期访问版本将在未来几天内向Gemini Advanced、Business和Enterprise用户开放,目前仅支持英语。
此次升级由谷歌最新的AI文本转图像生成器Imagen3提供支持。Imagen3最初于本月初通过AI Test Kitchen悄然推出,现已在Gemini的所有语言版本中得到应用。升级后的工具能够生成从照片级逼真的风景到纹理油画等多样化内容,只需"几句话"描述即可完成创作。
谷歌Gemini产品管理高级总监Dave Citron表示,新版Imagen3模型配备了内置安全措施,"与其他可用的图像生成模型相比,其性能更佳"。为了避免之前出现的历史不准确问题,谷歌对模型进行了优化,以确保生成的图像更加准确和适当。
值得注意的是,Gemini的这一功能与谷歌新推出的Remagine功能有所不同。后者专门用于在使用Pixel9手机系列拍摄的照片中融入AI元素。
为了进一步保障内容安全,Gemini不允许用户创建公众人物的逼真图像、涉及未成年人的内容或血腥、暴力和性爱场景。Citron承认:"当然,Gemini创建的每幅图像并非完美无缺,但我们将继续听取早期Gemini Advanced用户的反馈,不断改进。"
谷歌计划在未来将AI生成人物图像的能力扩展到更多用户和语言版本,以满足全球用户的需求。这一举措不仅展示了谷歌在AI图像生成技术上的进步,也反映了公司在应对技术伦理和安全挑战方面的决心。