近日,OpenAI 一起备受瞩版权诉讼中达成了一项协议,决定向原告律师披露用于训练生成性 AI 模型的数据。

急救中心,数据分析员

图源备注:图片由AI生成,图片授权服务商Midjourney

这场官司的原告是包括保罗・特伦布雷、莎拉・尔弗曼、迈克尔・查邦、大卫・亨利・黄和塔 - 内西・茨等多位知名作家。他于去年对 OpenAI 及其附属提起诉讼,指控其 AI 在未经授权的情况下使用了他们的作品,并在此基础生成文本,违反了美国版权法和州不公平竞争法。

根据美国地方法罗伯特・尔曼的裁定,原告的将获得进入 OpenAI 设立的安全的权限,在此可以查看训练数据这一过程受到严格限制。安全室内禁止任何录音设备,OpenAI 法律团队也有权查看律师在房内所做的任何笔记。这些措施使得训练数据的披露更像是对敏感源代码的审查,而非简单的信息共享。

尽 OpenAI 在法律上坚称其使用版权作品的方式符合 “合理使用”,但此事引发了更多的关注因为如果 OpenAI 训练数据被广泛披露,可能会引发更多的法律诉讼。而目前,针对 OpenAI 的版权指控不仅来自这几位作家,还有其他的原告也在发起类似的诉讼。

值得一提的是,未来可能有更多的法规要求 AI 开发商更为透明地披露其训练数据。欧盟的《人工智能法》预计将在2025年生效,要求模型提供商公开训练数据的详细信息,以满足那些对其权益有合法需求的群体。此外,加利福尼亚州也通过了一项 AI 数据透明度法案,州长签字。

尽管 OpenAI 坚持其生成的内容是基于对语言、推理和世界的理解,但法律上关于 AI 模型的行为是否合适仍然存在争议。随着越来越多的诉讼和立法提案出现,AI 领域的未来仍然充满不确定性。

划重点:

📝 OpenAI 同意向律师披露训练数据,满足版权讼需要。

🔒 数据查看在严格控制的安全环境中进行,禁止携带录音设备。

⚖️ 未来可能面临更多法规,推动 AI 数据透明度的要求