『Wired』誌の報道によると、アップル、NVIDIA、Anthropic、Salesforceなど複数のテクノロジー大手企業が、数千本のYouTube動画を許可なく使用してAIモデルを訓練していたことが発覚し、深刻な著作権と倫理上の論争を引き起こしています。

報道によると、これらの企業は様々なYouTube動画の字幕をAIトレーニングデータセットに統合していました。影響を受けたクリエイターは、人気YouTuberのMKBHD、MrBeast、Jacksepticeye、コメディアンのStephen Colbert、John Oliver、Jimmy Kimmel、MIT、Khan Academy、ハーバード大学などの教育チャンネル、ウォールストリートジャーナル、NPRなどの主要メディアなど、幅広い範囲に及びます。

ロボット 人工知能 顔認識 AI

画像出典:AI生成画像、画像ライセンス提供元Midjourney

これらのデータは実際には、Eleuther AIという非営利団体がダウンロードして整理したものです。同団体はこれらのコンテンツを、「The Pile」という大規模データセットの一部として公開し、小規模開発者や研究者向けのトレーニング素材として提供することを意図していました。しかし、これらのデータセットはその後、大手テクノロジー企業によって利用されました。

注目すべきは、アップルなどの企業はYouTubeから直接これらのデータを取得したわけではなく、Eleuther AIが整理したデータセットを使用していたことです。技術的な観点からは、YouTubeの利用規約に直接違反したのはEleuther AIであり、これらのテクノロジー企業ではありません。

この事件は、AIトレーニングデータのソースの合法性と倫理性に関する議論を引き起こしました。これは、急速に発展するAI分野におけるデータの著作権と使用許諾の重要性、そして既存の法律・規制がこれらの新しい技術的課題に直面した際の不備を浮き彫りにしています。同時に、クリエイター、プラットフォーム、AI企業間の権利バランスについても新たな考察を促しています。