Meta एक कॉपीराइट उल्लंघन के मुकदमे का सामना कर रहा है, जिसमें अभियोजक के वकील का कहना है कि Meta के सीईओ मार्क ज़ुकरबर्ग ने कंपनी को Llama AI मॉडल को प्रशिक्षित करने के लिए पायरेटेड ई-बुक्स और लेखों के डेटा सेट का उपयोग करने की अनुमति दी। यह मामला कई तकनीकी दिग्गजों के खिलाफ दर्ज किए गए कई कॉपीराइट मुकदमों में से एक है, जिन पर बिना अनुमति के कॉपीराइटेड कार्यों का उपयोग करके AI मॉडल का प्रशिक्षण देने का आरोप है।
बुधवार की रात को कैलिफ़ोर्निया के उत्तरी जिले के अमेरिकी जिला अदालत में दायर दस्तावेज़ में, अभियोजक ने फिर से Meta के पिछले साल के अंत में दिए गए गवाह बयान की पुष्टि की, जिसमें बताया गया था कि ज़ुकरबर्ग ने Llama से संबंधित प्रशिक्षण के लिए LibGen नामक डेटा सेट के उपयोग की अनुमति दी। LibGen को एक "लिंक एग्रीगेटर" के रूप में देखा जाता है, जो बड़ी संख्या में कॉपीराइटेड शैक्षणिक प्रकाशनों को प्रदान करता है। हालाँकि इस वेबसाइट को कॉपीराइट उल्लंघन के लिए कई बार मुकदमा किया गया है और बंद करने का आदेश दिया गया है, फिर भी यह Cengage Learning, McGraw Hill जैसे बड़े प्रकाशकों के कार्यों को प्रदान करना जारी रखता है।
छवि स्रोत नोट: छवि AI द्वारा उत्पन्न, छवि लाइसेंसिंग सेवा प्रदाता Midjourney
दस्तावेज़ में उल्लेख किया गया है कि Meta के भीतर एक कर्मचारी ने स्वीकार किया है कि LibGen एक "हम जानते हैं कि यह एक पायरेटेड डेटा सेट है," और कहा है कि इसका उपयोग कंपनी की नियामक अधिकारियों के साथ बातचीत की स्थिति पर नकारात्मक प्रभाव डाल सकता है। विशेष रूप से, Meta के इंजीनियर निकोलाय बाश्लिकोव पर आरोप है कि उन्होंने स्क्रिप्ट लिखी जो LibGen ई-बुक्स में कॉपीराइट जानकारी को हटाने के लिए थी, जिसमें "कॉपीराइट" और "धन्यवाद" शब्द शामिल थे। Meta पर यह भी आरोप लगाया गया है कि उसने वैज्ञानिक पत्रिकाओं के लेखों से कॉपीराइट मार्क और स्रोत मेटाडेटा को हटाया है, ताकि उसके उल्लंघन के कार्यों को छुपाया जा सके।
और अधिक विवादास्पद यह है कि Meta पर आरोप है कि उसने LibGen सामग्री को टॉरेंटिंग के माध्यम से डाउनलोड किया है और इन चुराए गए कॉपीराइट वाले फ़ाइलों के प्रसार में मदद की है। टॉरेंटिंग एक ऐसी विधि है जिसमें उपयोगकर्ता फ़ाइलों को साझा करते समय एक साथ फ़ाइलों को डाउनलोड करते हैं। अभियोजक के वकील का कहना है कि Meta ने टॉरेंटिंग में भाग लेकर वास्तव में कॉपीराइट उल्लंघन का एक और रूप लागू किया है। हालाँकि Meta के इंजीनियरों ने इस पर आपत्ति जताई है, यह तर्क करते हुए कि यह व्यवहार अवैध है, फिर भी Meta AI के प्रमुख अहमद अल-डाहले के समर्थन के साथ इस व्यवहार को जारी रखता है।
ये आरोप स्पष्ट रूप से पिछले साल अप्रैल में "न्यूयॉर्क टाइम्स" की रिपोर्ट के साथ मेल खाते हैं, जिसमें यह संकेत दिया गया था कि Meta ने AI डेटा एकत्र करते समय घटिया प्रथाओं का पालन किया। रिपोर्ट के अनुसार, Meta ने अफ्रीकी ठेकेदारों को पुस्तक सारांश संकलित करने के लिए नियुक्त किया था और साइमोन एंड शस्टर नामक प्रकाशक को अधिग्रहित करने पर विचार किया था। हालांकि, Meta के कार्यकारी अधिकारियों ने माना कि कॉपीराइट लाइसेंस पर बातचीत में बहुत समय लगता है, इसलिए उचित उपयोग सिद्धांत उनके मुख्य बचाव तर्क बन गए।
वर्तमान में, मामले की सुनवाई का निष्कर्ष नहीं निकला है, और यह केवल Meta के प्रारंभिक Llama मॉडल से संबंधित है। हालाँकि अदालत ने 2023 में AI से संबंधित कई कॉपीराइट मुकदमे खारिज कर दिए थे, यह कहते हुए कि अभियोजक ने उल्लंघन का प्रमाण नहीं दिया, लेकिन इस मामले में आरोप फिर भी Meta पर नकारात्मक प्रभाव डाल सकते हैं। मुख्य न्यायाधीश विंस चाब्रिया ने बुधवार के आदेश में कहा कि उन्होंने Meta के अधिकांश दस्तावेज़ों को हटाने की मांग को खारिज कर दिया, यह कहते हुए कि दस्तावेज़ों का हटाना स्पष्ट रूप से नकारात्मक प्रचार से बचने के लिए था, न कि संवेदनशील व्यावसायिक जानकारी की सुरक्षा के लिए।
यह मामला इस बात पर व्यापक चर्चा को जारी रखेगा कि तकनीकी कंपनियाँ कैसे कॉपीराइट कार्यों का उपयोग करके AI मॉडल को प्रशिक्षित करती हैं, विशेष रूप से उचित उपयोग और कॉपीराइट संरक्षण के बीच की सीमा के मुद्दे पर।