हाल ही में, प्रिंसटन विश्वविद्यालय की अनुसंधान टीम ने एक दिलचस्प शोध रिपोर्ट जारी की, जिसमें बताया गया कि अगस्त 2024 में, विकिपीडिया पर लगभग 4.36% नई लेखों में महत्वपूर्ण AI जनित सामग्री शामिल है।
यह अध्ययन क्रेस्टन ब्रूक्स, सैमुअल एग्गर्ट और डेनिस पेस्कॉफ द्वारा संयुक्त रूप से किया गया, जिन्होंने इन AI जनित सामग्री का पता लगाने के लिए GPTZero और Binoculars नामक उपकरणों का उपयोग किया।
शोध से पता चलता है कि GPT-3.5 के रिलीज से पहले के डेटा की तुलना में, 2024 के विकिपीडिया लेखों में AI जनित सामग्री में स्पष्ट वृद्धि हुई है। जांच की गई 2909 अंग्रेजी विकिपीडिया लेखों में, GPTZero ने 156 लेखों को चिह्नित किया, जबकि Binoculars ने 96 लेखों को चिह्नित किया, और इन दोनों उपकरणों के बीच 45 लेखों में ओवरलैप था।
चिह्नित लेख आमतौर पर गुणवत्ता में निम्न होते हैं, और इनमें संदर्भ भी कम होते हैं, और विकिपीडिया के ज्ञान नेटवर्क में अच्छी तरह से समाहित नहीं होते हैं। कुछ लेख तो आत्म-प्रचारित लगते हैं, जो व्यक्तिगत या व्यावसायिक प्रचार से संबंधित होते हैं, और अक्सर केवल सतही संदर्भों के साथ होते हैं, जैसे व्यक्तिगत YouTube वीडियो।
राजनीतिक सामग्री के संदर्भ में, आठ लेख स्पष्ट रूप से विशिष्ट विचारों को बढ़ावा देते हैं, जिनमें कुछ विवादास्पद विषय शामिल हैं, जैसे कि अल्बानिया के इतिहास से संबंधित संपादन युद्ध। इसके अलावा, कुछ उपयोगकर्ताओं ने बड़े भाषा मॉडल (LLMs) का उपयोग करके कुछ असामान्य विषयों पर सामग्री लिखी है, जिसमें कवक, भोजन और खेल शामिल हैं, यहां तक कि अध्याय वार पुस्तक सारांश की सामग्री भी है।
शोध ने विकिपीडिया की AI जनित सामग्री की तुलना Reddit और संयुक्त राष्ट्र के समाचार पत्रों से की, और पाया कि Reddit पर AI जनित सामग्री विकिपीडिया की तुलना में काफी कम है, जो 1% से भी कम है। यह दर्शाता है कि Reddit पर AI जनित सामग्री या तो बहुत कम है, या इसे सेंसर किया गया है, या इसका पता लगाना मुश्किल है। जबकि संयुक्त राष्ट्र के AI जनित समाचार पत्रों में उल्लेखनीय वृद्धि हुई है, जो 2022 में 1% से कम से बढ़कर 2024 में 20% हो गया है।
रिपोर्ट के अंत में यह जोर दिया गया कि जनरेटिव LLMs के उदय के साथ, AI डिटेक्शन उपकरण भी लगातार विकसित हो रहे हैं। लेकिन विभिन्न पाठ की लंबाई, क्षेत्रों और मानव-मशीन एकीकरण जैसे विभिन्न संदर्भों में इन डिटेक्टर्स का मूल्यांकन करना अभी भी चुनौतियों का सामना कर रहा है।
AI जनित सामग्री की चुनौतियों का सामना करने के लिए, व्यक्तियों, शैक्षणिक संस्थानों, व्यवसायों और सरकारों को मानव निर्मित सामग्री को सत्यापित करने के लिए विश्वसनीय तरीकों की सक्रिय रूप से खोज करनी चाहिए। विभिन्न देशों के नियामक संस्थाओं को भी AI जनित सामग्री के प्रबंधन को मजबूत करना चाहिए। उदाहरण के लिए, चीन ने पहले से ही इंटरनेट पर AI जनित जानकारी की पारदर्शिता बढ़ाने के लिए कदम उठाना शुरू कर दिया है और संबंधित मसौदा नियम जारी किए हैं। जबकि भारत ने इस वर्ष AI संबंधित सामग्री के लेबलिंग के लिए सुझाव जारी किया है, हालांकि यह प्रस्ताव व्यापक विवाद और आलोचना का विषय बना है।
मुख्य बिंदु:
📊 अध्ययन से पता चलता है कि लगभग 4.36% विकिपीडिया के नए लेख AI जनित सामग्री हैं।
🔍 Reddit पर AI जनित सामग्री 1% से कम है, जो स्पष्ट अंतर दर्शाता है।
🌐 विभिन्न देश AI जनित सामग्री के लिए नियामक उपायों और लेबलिंग आवश्यकताओं की खोज कर रहे हैं।