抄袭检测公司Copyleaks最近发布报告指出,OpenAI推出的GPT-3.5大语言模型生成内容中,高达60%含有不同形式的抄袭。Copyleaks使用自主开发的评分方法,考量文本相似度、微小改动、释义等多方面因素将相似内容判定为“抄袭”。计算机科学、物理学、心理学等学科的相似度最高,而戏剧、人文学科、英语的相似度较低。OpenAI表示已经采取各种措施限制无意记忆,使用条款也明确禁止用户故意让模型反编内容。此外,除了纽约时报提起的知名诉讼案,一些内容创作者也试图主张AI模型就是在他们的作品上得到训练的,所以产出近似副本内容也应该给予分成。