OpenAI、著作権侵害の証拠を誤って削除か？ニューヨーク・タイムズが提訴！

最近、ニューヨーク・タイムズ（The New York Times）とデイリー・ニュース（Daily News）が、OpenAIを共同で提訴しました。OpenAIが彼らの作品を無断で使用してAIモデルを訓練したと主張しています。

この訴訟は、原告側の弁護士チームが最新の法廷文書で、OpenAIのエンジニアが関連データを処理中に、事件に重要な影響を与える可能性のある証拠を誤って削除したと指摘したことで、世間の注目を集めています。

著作権

OpenAIは秋に、原告側の弁護士チームが訓練データに著作権が含まれているかどうかを検索できるように、2台の仮想マシンを提供することに合意したとされています。仮想マシンは、コンピューターのオペレーティングシステム内で動作する仮想的なコンピューターで、通常はテスト、データバックアップ、アプリケーションの実行に使用されます。11月1日以降、ニューヨーク・タイムズとデイリー・ニュースの法律顧問と彼らが雇った専門家は、OpenAIの訓練データで150時間以上作業していました。

しかし、11月14日、OpenAIのエンジニアが誤って、そのうちの1台の仮想マシンに保存されていた検索データを削除してしまいました。原告弁護士の書簡によると、OpenAIは削除されたデータの復元を試み、ほとんど成功しましたが、「復元不可能な」フォルダ構造とファイル名のため、復元されたデータは、ニュース原告の記事がどのようにOpenAIのモデルの訓練に使用されたかを特定するために使用できませんでした。

原告側の法律顧問は、この削除が意図的なものではないと考えていると述べていますが、この事件は、OpenAIが「自身のデータセット内から潜在的な著作権侵害コンテンツを検索する上で最適な立場にある」ことを示しています。つまり、OpenAIは自身のツールを活用して、関連する著作権侵害コンテンツをより効果的に見つけるべきだということです。

OpenAIは、この事件やその他の同様の事件において、公開されているデータを使用してモデルを訓練することはフェアユース（fair use）であると一貫して主張しています。つまり、OpenAIは、これらのモデルから利益を得ているにもかかわらず、これらの例の使用について著作権料を支払う必要はないと考えているということです。

注目すべきは、OpenAIは、AP通信、ビジネスインサイダー、フィナンシャルタイムズなど、ますます多くの新しいメディアとライセンス契約を締結していることです。しかし、これらの契約の具体的な条項については、OpenAIは公開していません。コンテンツパートナーであるDotdashは、年間少なくとも1600万ドルの報酬を得ているとされています。

法的問題については論争がありますが、OpenAIは、許可なく特定の著作権のある作品をAIの訓練に使用したことを確認も否定もしていません。