GameGen-X
オープンワールドゲームの動画を生成・インタラクティブに制御するための拡散変換モデル
一般製品プログラミングゲーム生成インタラクティブ制御
GameGen-Xは、オープンワールドゲームの動画を生成およびインタラクティブに制御するために設計された拡散変換モデルです。本モデルは、革新的なキャラクター、ダイナミックな環境、複雑なアクション、多様なイベントなど、ゲームエンジンの様々な特性をシミュレートすることで、高品質でオープンな領域の動画生成を実現しています。さらに、インタラクティブな制御機能を提供し、現在の動画断片に基づいて将来のコンテンツを予測・変更することで、ゲームプレイのシミュレーションを実現します。このビジョンを実現するために、まず、オープンワールド動画ゲームデータセット(OGameData)をゼロから収集・構築しました。これは、150種類以上のゲームから100万を超える多様なゲーム動画断片を含む、オープンワールドゲーム動画の生成と制御のための最初の、そして最大のデータセットであり、すべての断片にはGPT-4oによる情報性のキャプションが付けられています。GameGen-Xは、基礎モデルの事前学習と指示微調整という2段階のトレーニングプロセスを経て開発されました。まず、テキストから動画への生成と動画の継続を用いて事前学習を行い、長シーケンス、高品質のオープン領域ゲーム動画生成能力を付与しました。さらに、インタラクティブな制御機能を実現するために、ゲーム関連のマルチモーダル制御信号エキスパートを統合するInstructNetを設計しました。これにより、ユーザー入力に基づいて潜在表現を調整することが可能になり、動画生成において初めて、キャラクターインタラクションとシーンコンテンツの制御を統一しました。指示微調整中は、InstructNetのみが更新され、事前学習済みの基礎モデルは固定されました。これにより、インタラクティブな制御機能の統合によって、生成される動画コンテンツの多様性と品質が損なわれることはありません。GameGen-Xは、生成モデルを用いたオープンワールドビデオゲームデザインにおける大きな飛躍を意味します。これは、生成モデルが従来のレンダリング技術の補助ツールとしての可能性を示しており、創造的な生成とインタラクティブな能力を効果的に組み合わせていることを示しています。
GameGen-X 最新のトラフィック状況
月間総訪問数
42
直帰率
41.30%
平均ページ/訪問
1.0
平均訪問時間
00:00:00