最近、Meta社の人工知能トレーニングにおける手法が広く注目を集めています。訴訟によると、同社は許可を得ることなく大量の海賊版電子書籍や記事をダウンロードし、人工知能モデルのトレーニングに使用したとして非難されています。この事件の中心は、Meta社の行動を裏付ける証拠となる数通の流出したメールです。

著作権、海賊版

メールには、Meta社が数千万冊の海賊版書籍を含む物議を醸している大規模データセット「LibGen」をダウンロードしたことが認められています。原告が提出した裁判書類によると、Meta社は「Anna's Archive」というウェブサイトを通じて、複数のシャドウライブラリから少なくとも81.7TBのデータをダウンロードしており、その中にはZ-LibraryとLibGenからの少なくとも35.7TBのデータが含まれています。さらに、Meta社は以前にもLibGenから80.6TBのデータをダウンロードしていました。これらの数字は、Meta社がこの違法行為において驚くべき規模で関わっていたことを示しています。原告は、他の小規模な海賊行為は法的追及につながっているにもかかわらず、Meta社の行為はさらに深刻だと指摘しています。

メールの内容では、Meta社の従業員もその行為の法的リスクについて懸念を表明していました。2023年4月、同社の研究エンジニアであるニコラ・バシュリコフは「会社のノートパソコンでBTをダウンロードするのは適切ではない」と述べていました。2023年9月には、バシュリコフの反対の声はさらに強まり、法務チームに相談しました。彼は「Torrentを使用することは、ファイルを『シード』する、つまりコンテンツを外部に共有することを意味します。これは法律上許されていません」と指摘しました。しかし、このような警告にもかかわらず、Meta社はダウンロードと共有活動を隠蔽し、「シード」行為の追跡可能性を最小限に抑えるために設定を編集したようです。

Meta社は、データセットをMeta社以外のサーバーにダウンロードすることで、自社のサーバーに追跡されるリスクを軽減しようとしたとも伝えられています。この一連の行為は、Meta社におけるデータ使用と著作権に関する深い反省を促しています。

要点:

📚 Meta社は、AIトレーニングに使用したとされる81.7TBの海賊版書籍を違法にダウンロードしたとして非難されています。

⚖️ 従業員は法的リスクについて懸念を表明し、ダウンロード行為が法律に抵触する可能性があると警告していました。

🔍 Meta社は、隠蔽と社外サーバーの使用によって法的責任を回避しようとしていたようです。