OpenAIが開発した動画生成AI「Sora」は、発表以来大きな注目を集めていますが、その学習データの詳細は謎に包まれていました。しかし、その謎の一端が明らかになりつつあります。Soraの学習データには、Twitchのゲーム実況動画や攻略動画が大量に含まれている可能性が高いのです!
Soraは熟練の「模倣職人」のようなもので、テキストプロンプトや画像だけで20秒の長尺動画を生成し、様々なアスペクト比や解像度にも対応できます。今年2月、OpenAIがSoraを初めて公開した際、そのモデルが「マインクラフト」の動画で「鍛錬」されたと示唆していました。では、「マインクラフト」以外にも、Soraの「秘伝の書」にはどのようなゲームのデータが隠されているのでしょうか?
驚くべきことに、Soraは様々なゲームジャンルに精通しているようです。「マリオ」を彷彿とさせるクローンゲームの動画(多少の欠陥はありますが)を生成したり、まるで「コールオブデューティ」と「カウンターストライク」が融合したような白熱した一人称視点シューティングゲームの映像を再現したり、90年代の「忍者タートルズ」アーケードゲームの格闘シーンを再現して、まるで子供時代の思い出にタイムスリップしたかのような体験を与えてくれます。

さらに驚くべきことに、SoraはTwitchライブ配信の形式にも精通しており、大量のライブ配信コンテンツを「視聴」していたことを示唆しています。Soraが生成した動画のスクリーンショットは、ライブ配信のフレーム構造を正確に捉えているだけでなく、人気配信者Auronplayの容姿、さらには左腕のタトゥーまで忠実に再現しています。

それだけではありません。Soraは別のTwitch配信者Pokimaneも「認識」しており、彼女に似た容姿のキャラクターの動画を生成しています。もちろん、著作権の問題を避けるため、OpenAIは商標キャラクターを含む動画の生成を阻止するフィルタリングメカニズムを導入しています。
OpenAIは学習データの出所について詳細を明らかにしていませんが、様々な兆候から、ゲームコンテンツがSoraの学習データに含まれている可能性が高いことが示唆されています。OpenAIの前CTOであるミラ・ムラティ氏は3月にウォールストリートジャーナルのインタビューで、SoraがYouTube、Instagram、Facebookのコンテンツを使用して学習したことを直接否定していません。OpenAIはSoraの技術仕様書の中で、「公開されているデータ」とShutterstockなどのメディアライブラリからのライセンスデータを使用していると認めています。

もしゲームコンテンツがSoraの学習に使用されていた場合、特にOpenAIがSoraを基にさらにインタラクティブな体験を開発した場合、一連の法的問題を引き起こす可能性があります。Pryor Cashmanの知的財産権弁護士であるジョシュア・ウェゲンスバーグ氏は、許可なくゲーム動画をAI学習に使用することは大きなリスクを伴うと指摘しています。なぜなら、AIモデルの学習には通常、学習データのコピーが必要であり、ゲーム動画には多くの著作権で保護されたコンテンツが含まれているからです。
Soraのような生成AIモデルは確率に基づいています。大量のデータからパターンを学習し、予測を行います。この能力により、世界の仕組みを「学習」することができます。しかし同時に、特定のプロンプトの下で、学習データと非常に類似したコンテンツを生成する可能性も存在します。これはクリエイターたちの強い反感を買い、許可なく自分の作品が学習に使用されていると主張する声が上がっています。
現在、マイクロソフトとOpenAIは、AIツールがライセンスコードを複製したとして訴えられています。Midjourney、Runway、Stability AIなどのAIアートアプリケーション企業も、アーティストの権利侵害で訴えられています。また、大手音楽会社はAI楽曲生成器を開発するスタートアップ企業UdioとSunoを訴えています。
多くのAI企業は長年「フェアユース」原則を主張し、自社のモデルが創造するのは「変容的」な作品であり、剽窃ではないと主張してきました。しかし、ゲームコンテンツは特殊な性質を持っています。Dorsey & Whitney法律事務所の著作権弁護士であるエバン・エベリスト氏は、ゲーム動画には少なくとも2層の著作権保護が関与すると指摘しています。ゲーム開発者が所有するゲームコンテンツの著作権と、プレイヤーまたは動画制作者が制作した独自の動画の著作権です。一部のゲームでは、ユーザー生成コンテンツの著作権という第3の権利が存在する場合もあります。
例えば、「フォートナイト」では、プレイヤーが独自のゲームマップを作成し、他の人と共有することができます。これらのマップに関するゲーム動画には、Epic、ゲームプレイヤー、マップ作成者の少なくとも3人の著作権者が関与します。もし裁判所がAIモデルの学習に著作権上の責任があると判断した場合、これらの著作権者全員が潜在的な原告またはライセンス供与元となる可能性があります。
さらに、ウェゲンスバーグ氏は、ゲーム自体にも独自のテクスチャなど多くの「保護可能な」要素があり、裁判官は知的財産権訴訟においてこれらの要素を考慮する可能性があると指摘しています。

現在、Epic、マイクロソフト(「マインクラフト」を所有)、ユービーアイソフト、任天堂、Roblox、「サイバーパンク2077」の開発元であるCD Projekt Redなど、多くのゲームスタジオやパブリッシャーはこの件についてコメントしていません。
たとえAI企業がこれらの法的紛争に勝訴したとしても、ユーザーが無罪放免されるわけではありません。生成モデルが著作権で保護された作品を複製した場合、その作品を公開したり、他のプロジェクトに組み込んだりする者は、依然として知的財産権侵害の責任を問われる可能性があります。
一部のAI企業は、このような事態に対処するために補償条項を設けていますが、通常は例外事項が存在します。例えば、OpenAIの条項は企業顧客にのみ適用され、個人ユーザーには適用されません。さらに、著作権リスクに加えて、商標権違反などのリスクも存在します。例えば、出力コンテンツに、ゲーム内のキャラクターなど、マーケティングやブランドプロモーションに使用される資産が含まれている可能性があります。
世界モデルへの関心の高まりとともに、状況はさらに複雑化する可能性があります。世界モデルの応用の一つは、現実世界で電子ゲームを生成することですが、これらの「合成」ゲームがモデルの学習内容とあまりにも類似している場合、法的問題を引き起こす可能性があります。
McKool Smithの知的財産権訴訟弁護士であるエイブリー・ウィリアムズ氏は、ゲーム内でAIプラットフォームを学習させる音声、動作、キャラクター、楽曲、会話、アートワークなどの要素は、著作権侵害を構成すると指摘しています。生成AI企業に対する多くの訴訟で提起されている「フェアユース」に関する問題は、ビデオゲーム業界に、他のクリエイティブ市場と同様に影響を与えるでしょう。