近日,加利福尼亚州北区地方法院对一起引发广泛关注的版权诉讼作出裁决,部分驳回了针对GitHub C o pilot编程工具及其前底层技术OpenAI Codex的诉讼请求。这一裁决可能为使用受版权保护数据进行训练的新型技术工具开创先例。
该诉讼由约瑟夫·萨维里律师事务所于2022年提起,原告声称GitHub和OpenAI允许Co pil ot和Codex在未遵守版权声明和署名等许可条款的情况下复制源代码,从而侵犯了版权。
图源备注:图片由AI生成,图片授权服务商Midjourney
法院驳回了原告根据《数字千年版权法》(DMCA)第1202(b)条提出的诉讼请求。该条款禁止删除版权声明。法院裁定,原告未能证明Copilot倾向于以完全相同的方式复制受版权保护的代码。
原告引用了一项研究,称随着模型规模扩大,系统逐字复制训练数据的可能性会增加。然而,法官Jon S. Tigar指出,该研究显示C o p ilot"在良性情况下很少发出记忆的代码,大多数记忆仅在模型被提示与训练数据非常相似的长代码摘录时才会发生。"
这一判决表明,只要新型技术系统在正常使用中不定期逐字复制其训练材料,版权主张就可能面临挑战。该裁决还可能影响其他类似诉讼,如OpenAI与《纽约时报》的版权纠纷。
法院虽然驳回了不当得利和不正当竞争指控,但允许继续进行违反开源许可协议的指控。原告辩称,C o pilot未经署名就复制了代码,违反了开源许可条款。
参与诉讼的程序员兼律师马修·巴特里克强调了对潜在违反开源许可证的担忧,他认为像C o p ilot这样的编程工具在未经许可的情况下将开源作品货币化。
这一裁决引发了业界对新兴技术、版权保护和开源软件未来发展的广泛讨论。