テンセントは最近、GameGen-Oという革新的なビデオモデルを発表しました。これは、オープンワールドビデオゲーム向けに設計された業界初の拡散変換モデルです。従来のビデオモデルとは異なり、GameGen-Oは高品質なゲームコンテンツを生成できるだけでなく、ユーザーがゲームキャラクターを操作するようにビデオ内のキャラクターの行動をリアルタイムで制御することもできます。これは、人工知能とゲームのインタラクションにおける新たな時代を切り開くものです。
公式デモビデオ
GameGen-Oの最大の強みは、多様なコンテンツ生成能力と前例のないインタラクティブな制御にあります。ユーザーは必要に応じて、「リビアのゲラルト」や「アーサー・モーガン」などの様々なキャラクターを作成し、四季折々の環境に配置して、「バイクに乗る」や「雨が降る」など、様々なシーンを表現できます。さらにエキサイティングなのは、GameGen-Oがオープンワールド生成をサポートしており、ユーザーは構造化された指示と操作信号を通じて、リアルタイムでモデルにビデオクリップの生成を指示し、自分の仮想世界を演出できることです。
この画期的な技術を実現するために、テンセントのチームは多大な努力を払いました。彼らは、最初のオープンワールドビデオゲームデータセット(OGameData)を構築し、数百もの次世代オープンワールドゲームからデータを収集しました。厳格な選別と処理を経て、32,000本の元のビデオから約15,000本の高品質なビデオが厳選されました。これらのビデオは、シーン検出、美的評価、オプティカルフロー分析、意味的コンテンツの選別などの多段階の処理を経て、専門家モデルとマルチモーダル大規模モデルによって構造化された注釈が付けられ、モデルのトレーニングに精緻でインタラクティブなデータ基盤を提供しました。
GameGen-Oのトレーニングプロセスも独特で、基本モデルの事前トレーニングと指示微調整の2つの段階に分かれています。事前トレーニング段階では、モデルはテキストからビデオへの変換とビデオ継続タスクを通じて、オープンワールドビデオゲーム生成能力を学習します。指示微調整段階では、研究開発チームは事前トレーニングモデルを凍結し、トレーニング可能なInstructNetを導入して微調整を行い、モデルがマルチモーダル構造指示に従って後続のフレームを生成できるようにすることで、指示に基づいたビデオ生成とインタラクティブな制御を実現しました。
GameGen-Oはいくつかの点で改善の余地がありますが、AI駆動型ゲームコンテンツ作成における重要なマイルストーンであることは間違いありません。この技術は、ゲーム開発者にとって強力なツールとなるだけでなく、一般ユーザーにとっても自由に仮想世界を創造し探索できる新たな時代を切り開きます。技術の進歩に伴い、近い将来、誰もが簡単に自分だけの没入型ゲーム体験を創造できるようになることを期待できます。
GameGen-Oの登場は、ゲーム業界と人工知能分野のさらなる深い融合を示しており、テンセントのAI技術における能力を示すだけでなく、業界全体の将来の方向性を示唆しています。この技術がどのようにゲーム制作の様相を変え、プレイヤーにより多くの驚きと可能性をもたらすのか、注目しましょう。
プロジェクトアドレス:https://top.aibase.com/tool/gamegen-o