हाल ही में, तकनीकी दिग्गज एनवीडिया की डेटा अधिग्रहण के संबंध में एक गुप्त कार्रवाई का खुलासा हुआ है। मीडिया 404 की रिपोर्ट के अनुसार, एनवीडिया ने अपने कृत्रिम बुद्धिमत्ता मॉडल को प्रशिक्षित करने के लिए विशाल मात्रा में YouTube वीडियो डेटा को खींचा, जो कि कानूनी और नैतिक रूप से काफी अस्पष्ट है।
रिपोर्ट में कहा गया है कि एनवीडिया इन वीडियो डेटा का उपयोग कई AI मॉडल, जैसे कि कॉस्मोस गहन अध्ययन मॉडल, स्वचालित ड्राइविंग एल्गोरिदम, डिजिटल मानव AI अवतार उत्पाद, और 3D विश्व निर्माण उपकरण ओमनिवर्स को प्रशिक्षित करने के लिए कर रहा है।
जानकारी के अनुसार, एनवीडिया ने अपने डेटा खींचने के कार्य को छिपाने के लिए कई गुप्त उपाय अपनाए, कई "वर्चुअल मशीनों" का उपयोग किया और IP पते को बार-बार बदलते रहे, ताकि YouTube द्वारा पकड़े जाने से बचा जा सके। इसके अलावा, वीडियो निर्माताओं और YouTube की मूल कंपनी गूगल ने इस डेटा खींचने की गतिविधि के लिए कोई अनुमति नहीं दी। एनवीडिया के आंतरिक संचार से पता चलता है कि उनकी रणनीति काफी साहसी है, एक कार्यकारी ने ईमेल में उल्लेख किया कि वे "वीडियो डेटा फैक्ट्री" का निर्माण कर रहे हैं, जो हर दिन मानव जीवन के बराबर दृश्य अनुभव डेटा उत्पन्न कर सकती है।
दिलचस्प बात यह है कि जब कर्मचारियों ने इस डेटा अधिग्रहण की वैधता और नैतिकता पर चिंता व्यक्त की, तो प्रबंधन इस पर काफी आत्मविश्वास दिखा रहा था, यह मानते हुए कि यह सब उच्च स्तर के निर्णय हैं। ईमेल में लिखा गया: "हमारे पास सभी डेटा के लिए एक व्यापक अनुमोदन है।"
और भी चिंताजनक बात यह है कि एनवीडिया ने एक समय के लिए यह जानते हुए कि वे 1.3 करोड़ YouTube वीडियो वाले HD-VG-130M डेटा सेट का उपयोग कर रहे हैं, जबकि यह डेटा सेट मूल रूप से शैक्षणिक अनुसंधान के लिए बनाया गया था। कई विशेषज्ञों ने इस पर तीव्र असंतोष व्यक्त किया, यह मानते हुए कि अनुसंधान के लिए उपयोग किया जाने वाला डेटा वाणिज्यिक उपयोग के लिए उपयोग करना अनुचित है।
AI उद्योग के मुख्य प्रतिभागियों के रूप में, एनवीडिया ने बाजार में एक महत्वपूर्ण स्थिति प्राप्त की है, और इसके ग्राफ़िक्स प्रोसेसिंग यूनिट (GPU) कई गणना-गहन AI सिस्टम की नींव हैं। एनवीडिया के साथ सहयोग करने वाली कंपनियाँ जैसे OpenAI, माइक्रोसॉफ्ट और गूगल इस व्यवहार को लेकर चिंतित हैं। गूगल के एक प्रवक्ता ने कहा कि बिना अनुमति के YouTube डेटा का उपयोग स्पष्ट रूप से प्लेटफार्म की सेवा शर्तों का उल्लंघन है।
एनवीडिया ने मीडिया के जवाब में दावा किया है कि उनके AI प्रशिक्षण कार्य "कॉपीराइट कानून की भावना और शाब्दिक अर्थ के पूरी तरह से अनुरूप" हैं। हालांकि, इन सामग्री के निर्माताओं का इस कथन पर क्या विचार होगा?
मुख्य बिंदु:
📹 एनवीडिया ने गुप्त रूप से विशाल मात्रा में YouTube वीडियो डेटा को AI प्रशिक्षण के लिए खींचा, कानूनी और नैतिक मुद्दों ने ध्यान आकर्षित किया।
💻 आंतरिक ईमेल से पता चलता है कि एनवीडिया के कार्यकारी इस कार्य को पूरी तरह से अनुमोदित मानते हैं, और उनका दृष्टिकोण काफी साहसी है।
📜 गूगल ने बताया कि बिना अनुमति के YouTube डेटा का उपयोग स्पष्ट रूप से प्लेटफार्म की सेवा शर्तों का उल्लंघन है, एनवीडिया की प्रतिक्रिया विवाद को जन्म देती है।