एक मेटा के चल रहे आर्टिफिशियल इंटेलिजेंस कॉपीराइट मामले Kadrey v. Meta में, अदालत द्वारा जारी किए गए आंतरिक संदेशों ने इस कंपनी के Llama3 के विकास के दौरान की तीव्र प्रतिस्पर्धा और संभावित कॉपीराइट मुद्दों को उजागर किया। मेटा के वरिष्ठ नेतृत्व और शोधकर्ता पूरी मेहनत कर रहे हैं, ताकि वे AI मॉडल के विकास में OpenAI और Anthropic जैसी कंपनियों को पीछे छोड़ सकें, और उनके GPT-4 और Claude को प्रयासों का स्वर्ण मानक मानते हैं।

तीव्र प्रतिस्पर्धा की मानसिकता: मेटा ने OpenAI को हराने की शपथ ली

मेटा के जनरेटिव AI उपाध्यक्ष अहमद अल-डाहले के अनुसार, कंपनी ने Llama3 के विकास के दौरान अपने लक्ष्य को स्पष्ट रूप से GPT-4 की ओर निर्देशित किया है और उन्होंने AI प्रतिस्पर्धा में बढ़त पाने के लिए 64k GPU जैसे कुशल हार्डवेयर समर्थन के माध्यम से काम करने का संकल्प लिया है। अल-डाहले ने एक आंतरिक संदेश में लिखा: "हम 64k GPU लॉन्च करने जा रहे हैं! हमें यह सीखने की आवश्यकता है कि कैसे अग्रणी बनना है और इस प्रतियोगिता को जीतना है।"

हालांकि, मेटा ने ओपन-सोर्स AI मॉडल जारी किया है, लेकिन मेटा के वरिष्ठ अधिकारी उन प्रतिस्पर्धियों को हराने पर अधिक ध्यान केंद्रित कर रहे हैं, जो आमतौर पर अपने मॉडल के वेट्स को सार्वजनिक नहीं करते हैं, जैसे कि OpenAI और Anthropic, बल्कि अपने मॉडल को API के तहत रखते हैं, जिससे प्रतिस्पर्धा की एक मजबूत फोकस बनती है।

फेसबुक मेटावर्स मेटा

Mistral की अवहेलना और आंतरिक चिंता

फ्रांसीसी आर्टिफिशियल इंटेलिजेंस स्टार्टअप Mistral मेटा के सबसे बड़े सार्वजनिक प्रतिस्पर्धियों में से एक है, लेकिन मेटा के उच्च पदस्थ लोग इसके प्रति स्पष्ट रूप से तिरस्कार दिखा रहे हैं। एक संदेश में, अल-डाहले ने कहा: "Mistral हमारे लिए तुच्छ है, हमें इससे बेहतर करना चाहिए।" यह मेटा के अंदर AI प्रतिस्पर्धा के प्रति अत्यधिक चिंता और उनके उद्योग में मजबूत महत्वाकांक्षा को भी उजागर करता है।

इस बीच, मेटा के AI नेताओं ने आंतरिक संचार में बार-बार चर्चा की है कि वे Llama3 को प्रशिक्षित करने के लिए डेटा कैसे सक्रिय रूप से प्राप्त कर रहे हैं, और कुछ जानकारी से पता चलता है कि वरिष्ठ अधिकारी Llama3 के प्रति उत्साहित हैं, एक अधिकारी ने तो एक संदेश में उल्लेख किया: "Llama3 ही है जो मुझे वास्तव में चिंता है।"

कॉपीराइट मुद्दे और कानूनी चुनौतियाँ

जैसे-जैसे मेटा Llama3 के विकास में तीव्र प्रतिस्पर्धा का सामना कर रहा है, इसके उपयोग किए गए प्रशिक्षण डेटा ने भी कानूनी विवादों को जन्म देना शुरू कर दिया है। अभियोजकों ने आरोप लगाया है कि मेटा के अधिकारियों ने AI विकास की गति को तेज करने के दौरान संभवतः गुणवत्ता में कमी की है और प्रशिक्षण डेटा के रूप में कॉपीराइटेड पुस्तकों का उपयोग किया है।

एक संदेश में, शोधकर्ता ह्यूगो टौवरोन ने खुलासा किया कि मेटा ने Llama2 के प्रशिक्षण में उपयोग किए गए डेटा सेट के संयोजन को "खराब" बताया और Llama3 को अनुकूलित करने के लिए डेटा सेट में सुधार करने का सुझाव दिया। उन्होंने LibGen डेटा सेट के उपयोग में बाधाओं को साफ करने पर भी चर्चा की, जिसमें Cengage Learning, Macmillan Learning, McGraw Hill और Pearson Education जैसे प्रकाशकों के कॉपीराइटेड कार्य शामिल हैं।

कॉपीराइट मुद्दों के बावजूद, मेटा के सीईओ मार्क जुकरबर्ग ने जोर देकर कहा कि मेटा Llama मॉडल की प्रगति को आगे बढ़ाता रहेगा और OpenAI और Google जैसे अन्य बंद मॉडल के बीच के अंतर को कम करेगा।

मेटा का भविष्य और Llama3 की बाजार स्थिति

जुलाई 2024 में, जुकरबर्ग ने कहा कि Llama3 प्रदर्शन में सबसे उन्नत AI मॉडल के बराबर है और कुछ क्षेत्रों में अग्रणी स्थिति में है। उन्होंने उम्मीद जताई कि 2025 से मेटा की Llama श्रृंखला उद्योग के सबसे उन्नत AI मॉडल बन जाएगी। हालाँकि, Llama3 की रिलीज को लगातार बढ़ते कॉपीराइट मुकदमों का सामना करना होगा, विशेष रूप से इसके प्रशिक्षण डेटा के कारण उत्पन्न कानूनी जांच।