最近,谷歌宣布将其文本水印工具 SynthID 开源,旨在帮助开发者更好地识别 AI 生成的文本。这一工具现已通过谷歌的 “负责任生成 AI 工具包” 向公众开放使用。
谷歌 DeepMind 的研究副总裁 Pushmeet Kohli 表示,这项技术将使其他生成式 AI 开发者能够检测文本输出是否来自他们自己的大型语言模型(LLM),这将有助于他们以更负责任的方式构建 AI 应用。
在当今这个信息传播迅速的时代,水印技术显得尤为重要。随着大型语言模型被用来传播政治虚假信息、生成不当内容等,水印工具的需求也在不断上升。比如,加利福尼亚州正考虑将 AI 水印作为强制性要求,而中国早在去年就已开始要求使用水印。尽管如此,相关技术仍在不断完善之中。
谷歌的 SynthID 技术首次在去年8月被公布。它通过在生成的文本、图像、音频和视频中添加不可见的水印,使得 AI 生成的输出更易于识别。
具体来说,SynthID 会在文本输出中微调每个生成词的概率,使得这些修改在软件中可被识别但不被人类察觉。例如,当模型生成 “我最喜欢的热带水果是__。” 时,可能会选择 “芒果”、“荔枝”、“木瓜” 或 “榴莲” 等词。每个词都有一个概率分数,SynthID 会在不影响文本质量、准确性和创造性的前提下,调整这些分数。
这种调整会在整个生成的文本中持续进行,所以一段文本可能会有十个以上的调整分数,而整页内容可能会包含数百个。最终,这些调整后的概率分数模式将构成水印。谷歌表示,该系统已集成到其 Gemini 聊天机器人中,且不会影响生成文本的质量和速度。然而,它在短文本、已重写或翻译的内容以及针对事实问题的回应上仍面临一些挑战。
谷歌在一篇博客中指出:“SynthID 并不是识别 AI 生成内容的万能钥匙,但它是开发更可靠 AI 识别工具的重要基石,可以帮助数百万用户做出更明智的决策。”
项目入口:https://ai.google.dev/responsible/docs/safeguards/synthid?hl=zh-cn
划重点:
📜 SynthID 开源,帮助开发者识别 AI 生成的文本。
🛠️ 水印技术在应对虚假信息和不当内容中变得愈发重要。
💡 谷歌的 SynthID 能够微调文本生成的概率分数,形成水印。