OpenAI का वीडियो जनरेशन टूल Sora, इसके लॉन्च के बाद से ही ध्यान आकर्षित कर रहा है, लेकिन यह कहाँ से आया है, यह एक रहस्य बना हुआ है। अब, रहस्य का एक हिस्सा खुलता हुआ प्रतीत होता है: Sora के प्रशिक्षण डेटा में संभवतः Twitch से गेम स्ट्रीमिंग और ट्यूटोरियल वीडियो की एक बड़ी मात्रा छिपी हुई है!

Sora एक कुशल "नकल मास्टर" की तरह है, जो केवल टेक्स्ट संकेत या छवि के माध्यम से 20 सेकंड तक के वीडियो को "आसान" तरीके से उत्पन्न कर सकता है, और विभिन्न आस्पेक्ट रेशियो और रिज़ॉल्यूशन को संभाल सकता है। इस साल फरवरी में, OpenAI ने पहली बार Sora का खुलासा करते समय संकेत दिया था कि इसका मॉडल "Minecraft" वीडियो में "गंभीरता से प्रशिक्षण" ले रहा है। तो, "Minecraft" के अलावा, Sora के "कला के ग्रंथ" में और कौन से गेमिंग गाइड छिपे हुए हैं?

परिणाम आश्चर्यजनक हैं, Sora विभिन्न प्रकार के गेमिंग शैलियों में निपुण प्रतीत होता है। यह "मारियो" की छवि के साथ एक क्लोन गेम वीडियो उत्पन्न कर सकता है, हालांकि कुछ "छोटी कमियाँ" हैं; यह एक रोमांचक पहले व्यक्ति शूटर गेम का दृश्य भी अनुकरण कर सकता है, जैसे "Call of Duty" और "Counter-Strike" का "संयोग"; और यह 90 के दशक के "निन्जा कछुए" आर्केड गेम की लड़ाई के दृश्यों को पुन: उत्पन्न कर सकता है, जो आपको बचपन की यादों में ले जाता है।

image.png

यह और भी आश्चर्यजनक है कि Sora Twitch स्ट्रीमिंग के स्वरूप को भी अच्छी तरह से जानता है, यह इस बात का संकेत है कि इसने बड़ी मात्रा में स्ट्रीमिंग सामग्री "देखी" है। Sora द्वारा उत्पन्न वीडियो स्क्रिनशॉट न केवल स्ट्रीमिंग के ढांचे को सटीक रूप से कैप्चर करते हैं, बल्कि प्रसिद्ध स्ट्रीमर Auronplay की छवि को भी सजीवता से पुन: प्रस्तुत करते हैं, जिसमें उनके बाएँ हाथ पर टैटू भी शामिल है।

image.png

इतना ही नहीं, Sora एक अन्य Twitch स्ट्रीमर Pokimane को भी "जानता" है, और उसके समान दिखने वाले पात्र का वीडियो उत्पन्न करता है। निश्चित रूप से, कॉपीराइट मुद्दों से बचने के लिए, OpenAI ने एक फ़िल्टरिंग तंत्र स्थापित किया है, जो Sora को ट्रेडमार्क पात्रों वाले वीडियो उत्पन्न करने से रोकता है।

हालांकि OpenAI ने प्रशिक्षण डेटा के स्रोत के बारे में अस्पष्टता बनाए रखी है, लेकिन विभिन्न संकेत बताते हैं कि गेमिंग सामग्री संभवतः Sora के प्रशिक्षण सेट में शामिल की गई है। OpenAI के पूर्व CTO मिरा मुराती ने मार्च में "वॉल स्ट्रीट जर्नल" के साथ एक साक्षात्कार में सीधे तौर पर यह नहीं कहा कि Sora ने YouTube, Instagram और Facebook पर सामग्री का उपयोग किया है। OpenAI ने Sora की तकनीकी विशिष्टताओं में भी स्वीकार किया है कि इसने "सार्वजनिक रूप से उपलब्ध" डेटा और Shutterstock जैसे मीडिया लाइब्रेरी से लाइसेंस प्राप्त डेटा का उपयोग किया है।

image.png

यदि गेमिंग सामग्री वास्तव में Sora के प्रशिक्षण में उपयोग की गई है, तो इससे कई कानूनी समस्याएँ उत्पन्न हो सकती हैं, विशेष रूप से जब OpenAI Sora के आधार पर अधिक इंटरैक्टिव अनुभव विकसित करता है। Pryor Cashman के आईपी वकील जोशुआ वेगनबर्ग ने कहा कि बिना अनुमति के गेम वीडियो का AI प्रशिक्षण में उपयोग करना बड़े जोखिम का सामना करेगा, क्योंकि AI मॉडल को प्रशिक्षण डेटा की नकल करने की आवश्यकता होती है, और गेम वीडियो में कॉपीराइट से सुरक्षित सामग्री की एक बड़ी मात्रा होती है।

जनरेटिव AI मॉडल जैसे Sora, संभावनाओं पर आधारित होते हैं। ये बड़ी मात्रा में डेटा से पैटर्न सीखते हैं और भविष्यवाणी करते हैं। यह क्षमता इन्हें दुनिया के काम करने के तरीके को "सीखने" की अनुमति देती है। लेकिन साथ ही, एक निश्चित संकेत पर, मॉडल अपने प्रशिक्षण डेटा के बहुत समान सामग्री उत्पन्न कर सकता है। यह रचनाकारों की तीव्र असंतोष को जन्म देता है, जो मानते हैं कि उनके काम की अनुमति के बिना इसका उपयोग किया जा रहा है।

वर्तमान में, Microsoft और OpenAI को उनके AI उपकरणों के लाइसेंस कोड की नकल करने के आरोप में मुकदमा चलाया जा रहा है। Midjourney, Runway और Stability AI जैसे AI कला एप्लिकेशन कंपनियाँ भी कलाकारों के अधिकारों का उल्लंघन करने के आरोपों का सामना कर रही हैं। प्रमुख संगीत कंपनियों ने AI गाना जनरेट करने वाली स्टार्टअप कंपनियों Udio और Suno के खिलाफ भी मुकदमा दायर किया है।

कई AI कंपनियाँ लंबे समय से "उचित उपयोग" के सिद्धांत का समर्थन कर रही हैं, यह मानते हुए कि उनके मॉडल "परिवर्तनीय" कार्यों का निर्माण करते हैं, न कि नकल। लेकिन गेमिंग सामग्री की अपनी विशिष्टता है। Dorsey & Whitney के कॉपीराइट वकील एवन एवरिस्ट ने कहा कि गेम वीडियो कम से कम दो स्तरों के कॉपीराइट संरक्षण से संबंधित हैं: गेम डेवलपर्स के पास गेम सामग्री का कॉपीराइट है, और खिलाड़ियों या वीडियो निर्माताओं के पास अनूठे वीडियो का कॉपीराइट है। कुछ खेलों के लिए, एक तीसरे स्तर का अधिकार भी हो सकता है, यानी उपयोगकर्ता द्वारा उत्पन्न सामग्री का कॉपीराइट।

उदाहरण के लिए, "Fortnite" खिलाड़ियों को अपने गेम मैप बनाने और उन्हें दूसरों के साथ साझा करने की अनुमति देता है। इन मैप्स के बारे में एक गेम वीडियो में कम से कम तीन कॉपीराइट धारक शामिल होते हैं: Epic, गेम खिलाड़ी और मैप निर्माता। यदि अदालत ने AI मॉडल प्रशिक्षण में कॉपीराइट की जिम्मेदारी तय की, तो ये सभी कॉपीराइट धारक संभावित रूप से वादी या लाइसेंस स्रोत बन सकते हैं।

इसके अलावा, वेगनबर्ग ने यह भी कहा कि गेम में कई "संरक्षित" तत्व होते हैं, जैसे विशेष टेक्सचर आदि, जिन्हें न्यायाधीश आईपी मुकदमे में विचार कर सकते हैं।

image.png

वर्तमान में, Epic, Microsoft (जिसके पास "Minecraft" है), Ubisoft, Nintendo, Roblox और "Cyberpunk 2077" के डेवलपर CD Projekt Red सहित कई गेम स्टूडियो और प्रकाशकों ने इस मामले पर कोई टिप्पणी नहीं की है।

यहां तक कि यदि AI कंपनियाँ इन कानूनी विवादों में जीतती हैं, तो उपयोगकर्ता भी उत्तरदायी नहीं हो सकते। यदि जनरेटिव मॉडल ने कॉपीराइट से सुरक्षित कार्यों की नकल की, तो उस कार्य को प्रकाशित करने या अन्य परियोजनाओं में शामिल करने वाले व्यक्ति को अभी भी आईपी उल्लंघन की जिम्मेदारी का सामना करना पड़ सकता है।

कुछ AI कंपनियाँ इस प्रकार की स्थितियों से निपटने के लिए मुआवजे की शर्तें स्थापित करती हैं, लेकिन आमतौर पर अपवाद होते हैं। उदाहरण के लिए, OpenAI की शर्तें केवल व्यावसायिक ग्राहकों के लिए लागू होती हैं, न कि व्यक्तिगत उपयोगकर्ताओं के लिए। इसके अलावा, कॉपीराइट जोखिम के अलावा, ट्रेडमार्क अधिकारों का उल्लंघन करने का भी जोखिम है, जैसे कि आउटपुट सामग्री में मार्केटिंग और ब्रांड प्रमोशन के लिए उपयोग की जाने वाली संपत्तियाँ शामिल हो सकती हैं, जिनमें गेम के पात्र भी शामिल हैं।

जैसे-जैसे लोग विश्व मॉडल में रुचि रखते हैं, स्थिति और भी जटिल हो सकती है। विश्व मॉडल का एक अनुप्रयोग वास्तविकता में वीडियो गेम उत्पन्न करना है, यदि ये "संश्लेषित" गेम मॉडल के प्रशिक्षण की सामग्री से बहुत समान हैं, तो कानूनी समस्याएँ उत्पन्न हो सकती हैं।

McKool Smith के आईपी मुकदमे के वकील एवरली विलियम्स ने कहा कि गेम में AI प्लेटफॉर्म के प्रशिक्षण के लिए आवाज, क्रियाएँ, पात्र, गाने, संवाद और कला जैसे तत्व कॉपीराइट उल्लंघन का गठन करते हैं। जनरेटिव AI कंपनियों के खिलाफ कई मुकदमों में "उचित उपयोग" के मुद्दे का उठाया जाना वीडियो गेम उद्योग पर अन्य रचनात्मक बाजारों की तरह ही प्रभाव डालेगा।