グーグルは先日、物理世界をシミュレートできる人工知能(AI)モデルの開発に特化した新チームを設立すると発表しました。このチームは、OpenAIの動画生成モデルSoraの共同責任者だったTim Brooks氏が率います。Brooks氏はX(旧Twitter)で、この新チームはグーグルのAI研究ラボであるGoogle DeepMindに所属すると述べています。

Brooks氏の発表によると、「DeepMindの計画は野心的で、世界をシミュレートする大規模な生成モデルの開発を目指しています。」とのこと。また、チームはグーグルのGemini、Veo、Genieチームと協力し、「重要な新たな課題」に取り組み、最高レベルの計算能力でモデル規模を拡大するとしています。Geminiはグーグルの主力AIモデルシリーズで、主に画像分析とテキスト生成に使用され、Veoはグーグル独自の動画生成モデルです。Genieは、ゲームや3D環境をリアルタイムでシミュレートできるグーグルの世界モデルの試みです。

image.png

Brooks氏によると、チームは「リアルタイムインタラクティブ生成」ツールを開発し、既存のマルチモーダルモデル(Geminiなど)との統合方法を研究するとのことです。業務説明には、「動画とマルチモーダルデータに基づいたAIトレーニングの大規模化は、人工汎用知能(AGI)実現の重要な道筋であると確信しています。」と記されています。AGIとは、人間が行えるあらゆるタスクを実行できる人工知能のことです。

世界モデルの開発には、著名なAI研究者Fei-Fei Lee氏が率いるWorld Labs、イスラエルのスタートアップ企業DecartやOdysseyなど、多くのスタートアップ企業や大手テクノロジー企業も取り組んでいます。これらの企業は、将来の世界モデルが、ビデオゲームや映画などのインタラクティブメディアの作成や、ロボットの訓練のような現実的なシミュレーションの実行に使用できると考えています。

しかし、クリエイティブ分野ではこの技術に対する見方が分かれています。最近の『Wired』誌の調査によると、アクティビジョン・ブリザードなどのゲーム開発会社は、AIを活用してコスト削減と生産性向上を図っていますが、その結果、大量の従業員が解雇されています。2024年のアニメーション組合の調査によると、2026年までに、アメリカの映画、テレビ、アニメーション業界で10万件以上の仕事がAIの影響を受ける見込みです。

それにもかかわらず、Odysseyなどの新興の世界モデル構築スタートアップ企業は、クリエイティブ専門家を置き換えるのではなく、協力していくことを約束しています。これがグーグルのアプローチになるかどうかは、まだ分かりません。さらに、著作権の問題も未解決です。一部の世界モデルのトレーニングでは、許可を得ずに動画ゲームのライブ配信クリップが使用され、関連企業が訴訟リスクにさらされている可能性があります。

グーグルは、YouTubeでモデルをトレーニングしたことはプラットフォームの利用規約に基づいて許可を得ていると主張していますが、具体的にどの動画を使用したかは明らかにされていません。