コピーレイクス社が最近発表したレポートによると、OpenAIが開発した大規模言語モデルGPT-3.5が生成するコンテンツの最大60%が、様々な形態の剽窃を含んでいるとのことです。コピーレイクス社は独自開発の評価方法を用いて、テキストの類似性、わずかな変更、言い換えなどを多角的に考慮し、類似したコンテンツを「剽窃」と判定しています。コンピュータサイエンス、物理学、心理学などの分野では類似性の度合いが高く、一方、演劇、人文科学、英語などの分野では低い傾向が見られます。OpenAIは、意図しない記憶を制限するための様々な対策を講じており、利用規約においても、ユーザーが意図的にモデルにコンテンツを逆コンパイルすることを禁じています。さらに、ニューヨーク・タイムズ紙が提起した有名な訴訟以外にも、一部のコンテンツ制作者は、AIモデルが自身の作品で学習されているため、類似したコンテンツの生成に対して報酬を支払うべきだと主張しようとしています。