हांगकांग विज्ञान और प्रौद्योगिकी विश्वविद्यालय, चीन विज्ञान और प्रौद्योगिकी विश्वविद्यालय आदि संस्थानों के शोधकर्ताओं ने हाल ही में GameGen-X मॉडल जारी किया है, जो एक विस्तारित परिवर्तक मॉडल है जिसे ओपन-वर्ल्ड गेम वीडियो बनाने और इंटरैक्टिव नियंत्रण के लिए डिज़ाइन किया गया है।
GameGen-X स्वयं ओपन-वर्ल्ड गेम वीडियो उत्पन्न कर सकता है, विभिन्न गेम इंजन कार्यों का अनुकरण कर सकता है, जिसमें नवीन पात्रों, गतिशील वातावरण, जटिल क्रियाएँ और विविध घटनाओं का निर्माण करना शामिल है, और यह आपके साथ इंटरैक्ट कर सकता है, जिससे आपको गेम डिजाइनर बनने का अनुभव मिलता है।
GameGen-X की एक बड़ी विशेषता इसकी इंटरैक्टिव कंट्रोल क्षमता है। यह वर्तमान गेम क्लिप के आधार पर भविष्य की सामग्री की भविष्यवाणी और परिवर्तन कर सकता है, जिससे गेमप्ले का अनुकरण संभव हो सके।
उपयोगकर्ता मल्टी-मोडल नियंत्रण संकेतों के माध्यम से, जैसे संरचित पाठ निर्देश और कीबोर्ड नियंत्रण, उत्पन्न सामग्री को प्रभावित कर सकते हैं, जिससे पात्रों के इंटरैक्शन और दृश्य सामग्री पर नियंत्रण प्राप्त होता है।
GameGen-X को प्रशिक्षित करने के लिए, शोधकर्ताओं ने पहला बड़ा ओपन-वर्ल्ड गेम वीडियो डेटा सेट OGameData बनाया। इस डेटा सेट में 150 से अधिक गेम्स से 1 मिलियन से अधिक विभिन्न गेम वीडियो क्लिप शामिल हैं, और इसके लिए GPT-4o का उपयोग करके जानकारीपूर्ण पाठ वर्णन उत्पन्न किया गया है।
GameGen-X का प्रशिक्षण प्रक्रिया दो चरणों में विभाजित है: आधार मॉडल पूर्व-प्रशिक्षण और निर्देश माइक्रो-ट्यूनिंग। पहले चरण में, मॉडल को टेक्स्ट से वीडियो उत्पन्न करने और वीडियो निरंतरता कार्यों के माध्यम से पूर्व-प्रशिक्षित किया गया, जिससे यह उच्च गुणवत्ता वाले, लंबे अनुक्रम के ओपन-डोमेन गेम वीडियो उत्पन्न करने में सक्षम हो गया।
दूसरे चरण में, इंटरैक्टिव कंट्रोल क्षमता प्राप्त करने के लिए, शोधकर्ताओं ने InstructNet मॉड्यूल डिज़ाइन किया, जो गेम से संबंधित मल्टी-मोडल नियंत्रण संकेत विशेषज्ञों को एकीकृत करता है।
InstructNet मॉडल को उपयोगकर्ता इनपुट के आधार पर संभावित प्रतिनिधित्व को समायोजित करने की अनुमति देता है, जिससे वीडियो उत्पन्न करने में पहली बार पात्रों के इंटरैक्शन और दृश्य सामग्री नियंत्रण को एकीकृत किया गया। निर्देश माइक्रो-ट्यूनिंग प्रक्रिया में, केवल InstructNet को अपडेट किया गया, जबकि पूर्व-प्रशिक्षित आधार मॉडल को फ्रीज कर दिया गया, जिससे मॉडल को उत्पन्न वीडियो सामग्री की विविधता और गुणवत्ता को खोए बिना इंटरैक्टिव कंट्रोल क्षमता को एकीकृत करने में मदद मिली।
प्रयोगात्मक परिणाम दर्शाते हैं कि GameGen-X उच्च गुणवत्ता वाले गेम सामग्री उत्पन्न करने में उत्कृष्टता प्रदर्शित करता है और पर्यावरण और पात्रों पर उत्कृष्ट नियंत्रण क्षमता प्रदान करता है, जो अन्य ओपन-सोर्स और व्यावसायिक मॉडलों से बेहतर है।
बेशक, यह AI अभी केवल एक प्रारंभिक चरण में है, वास्तव में गेम डिजाइनरों को बदलने के लिए अभी लंबा रास्ता तय करना है। लेकिन इसकी उपस्थिति ने गेम विकास में नई संभावनाएँ प्रदान की हैं। यह गेम सामग्री डिज़ाइन और विकास के लिए एक नई विधि प्रदान करता है, पारंपरिक रेंडरिंग तकनीकों के सहायक उपकरण के रूप में उत्पन्न मॉडल की क्षमता को प्रदर्शित करता है, और प्रभावी रूप से रचनात्मक उत्पत्ति और इंटरैक्टिव कार्यक्षमता को मिलाता है, भविष्य के गेम विकास के लिए नई संभावनाएँ लाता है।
प्रोजेक्ट पता: https://gamegen-x.github.io/