हाल ही में, ओपन सोर्स इनिशिएटिव (OSI) ने एक नई परिभाषा जारी की है, जो यह स्पष्ट करती है कि असली "ओपन सोर्स" आर्टिफिशियल इंटेलिजेंस क्या है। इस नए मानक ने टेक्नोलॉजी दिग्गजों का ध्यान आकर्षित किया है, विशेष रूप से मेटा के लामा मॉडल का, क्योंकि यह इन नियमों का पालन नहीं करता है। OSI हमेशा ओपन सोर्स सॉफ़्टवेयर के लिए उद्योग मानक निर्धारित करने वाला रहा है, लेकिन एआई सिस्टम में कुछ पारंपरिक लाइसेंस ऐसे तत्वों को कवर नहीं करते हैं, जैसे मॉडल प्रशिक्षण डेटा।

OSI की नई परिभाषा के अनुसार, किसी भी AI सिस्टम को जिसे असली ओपन सोर्स माना जाता है, तीन चीजें प्रदान करनी चाहिए: पहली, AI को प्रशिक्षित करने के लिए उपयोग किए गए डेटा के बारे में विस्तृत जानकारी, ताकि अन्य लोग इन परिणामों को समझ सकें और दोहरा सकें; दूसरी, AI को बनाने और चलाने के लिए पूरा कोड; और अंत में, प्रशिक्षण में सेटिंग्स और वेट्स जो AI के परिणामों पर प्रभाव डालते हैं।

बड़ा मॉडल कोड इंटरनेट

चित्र स्रोत नोट: चित्र AI द्वारा उत्पन्न, चित्र अधिकार सेवा प्रदाता मिडजर्नी

यह नियम मेटा के लामा मॉडल को सीधे चुनौती देता है। हालाँकि लामा को सार्वजनिक रूप से डाउनलोड और उपयोग किया जा सकता है, लेकिन इसके व्यावसायिक उपयोग पर कुछ प्रतिबंध हैं, और इसने प्रशिक्षण डेटा प्रदान नहीं किया है, इसलिए यह OSI के ओपन मानक को पूरा नहीं करता है। मेटा की प्रवक्ता फेथ आइशेन ने कहा कि वे OSI के साथ कई मामलों में सहमति रखते हैं, लेकिन इस परिभाषा पर उनके विचार भिन्न हैं। उन्होंने कहा कि "ओपन सोर्स AI" की परिभाषा देना आसान नहीं है, क्योंकि पारंपरिक परिभाषाएं आज के तेजी से विकसित हो रहे AI मॉडलों की जटिलता को कवर नहीं करती हैं।

OSI के कार्यकारी निदेशक स्टीफानो मफुल्ली ने कहा कि उन्होंने इस मानक को विकसित करने में दो साल बिताए, जिसमें वैश्विक विशेषज्ञों के साथ सहयोग किया। उन्होंने अकादमिक क्षेत्र, मशीन लर्निंग और प्राकृतिक भाषा प्रसंस्करण के विशेषज्ञों के साथ गहन बातचीत की, और सामग्री निर्माताओं के साथ सहयोग किया, ताकि यह सुनिश्चित किया जा सके कि यह समग्र हो।

मेटा द्वारा प्रशिक्षण डेटा की पहुंच को सीमित करने का मुख्य कारण सुरक्षा संबंधी चिंताएं हैं, लेकिन आलोचकों का मानना है कि इसके पीछे कानूनी जिम्मेदारी को कम करने और प्रतिस्पर्धात्मक लाभ की रक्षा करने के लिए हो सकता है। कई AI मॉडलों के प्रशिक्षण डेटा में लगभग निश्चित रूप से कॉपीराइट सामग्री शामिल होती है। अब, मेटा, ओपनएआई जैसे कंपनियों के खिलाफ मुकदमे बढ़ते जा रहे हैं, और वादी केवल अप्रत्यक्ष सबूत पर निर्भर करते हैं यह साबित करने के लिए कि उनके काम को स्क्रैप किया गया है।

एक ही समय में, मफुल्ली का मानना है कि वर्तमान स्थिति अतीत के समान है। उन्होंने 1990 के दशक में माइक्रोसॉफ्ट के ओपन सोर्स के प्रति दृष्टिकोण को याद किया, और कहा कि मेटा समान कारणों से अपनी तकनीक को बंद कर रहा है। उनके लिए, प्रशिक्षण डेटा "गुप्त हथियार" है।

मुख्य बिंदु:

🌐 OSI द्वारा जारी नई परिभाषा AI सिस्टम से प्रशिक्षण डेटा, कोड और सेटिंग्स की मांग करती है, "ओपन AI" मानकीकरण को बढ़ावा देती है।

🦙 मेटा का लामा मॉडल प्रशिक्षण डेटा प्रदान नहीं करने के कारण ओपन सोर्स मानक के अनुरूप नहीं माना जाता है, उद्योग के सवालों का सामना कर रहा है।

⚖️ कानूनी विवाद बढ़ रहे हैं, मेटा और अन्य AI कंपनियाँ कॉपीराइट सामग्री के उपयोग के कारण विभिन्न मुकदमे का सामना कर रही हैं, कानूनी जिम्मेदारी पर ध्यान आकर्षित हो रहा है।