सामग्री गुणवत्ता चिंताजनक! अध्ययन से पता चलता है कि लगभग 5% विकिपीडिया सामग्री एआई द्वारा उत्पन्न है

AIbase基地

द्वारा प्रकाशितAI समाचार · 6 मिनट पढ़ें · Oct 16, 2024

277

हाल ही में, प्रिंसटन विश्वविद्यालय की अनुसंधान टीम ने एक दिलचस्प शोध रिपोर्ट जारी की, जिसमें बताया गया कि अगस्त 2024 में, विकिपीडिया पर लगभग 4.36% नई लेखों में महत्वपूर्ण AI जनित सामग्री शामिल है।

यह अध्ययन क्रेस्टन ब्रूक्स, सैमुअल एग्गर्ट और डेनिस पेस्कॉफ द्वारा संयुक्त रूप से किया गया, जिन्होंने इन AI जनित सामग्री का पता लगाने के लिए GPTZero और Binoculars नामक उपकरणों का उपयोग किया।

विकिपीडिया

शोध से पता चलता है कि GPT-3.5 के रिलीज से पहले के डेटा की तुलना में, 2024 के विकिपीडिया लेखों में AI जनित सामग्री में स्पष्ट वृद्धि हुई है। जांच की गई 2909 अंग्रेजी विकिपीडिया लेखों में, GPTZero ने 156 लेखों को चिह्नित किया, जबकि Binoculars ने 96 लेखों को चिह्नित किया, और इन दोनों उपकरणों के बीच 45 लेखों में ओवरलैप था।

चिह्नित लेख आमतौर पर गुणवत्ता में निम्न होते हैं, और इनमें संदर्भ भी कम होते हैं, और विकिपीडिया के ज्ञान नेटवर्क में अच्छी तरह से समाहित नहीं होते हैं। कुछ लेख तो आत्म-प्रचारित लगते हैं, जो व्यक्तिगत या व्यावसायिक प्रचार से संबंधित होते हैं, और अक्सर केवल सतही संदर्भों के साथ होते हैं, जैसे व्यक्तिगत YouTube वीडियो।

राजनीतिक सामग्री के संदर्भ में, आठ लेख स्पष्ट रूप से विशिष्ट विचारों को बढ़ावा देते हैं, जिनमें कुछ विवादास्पद विषय शामिल हैं, जैसे कि अल्बानिया के इतिहास से संबंधित संपादन युद्ध। इसके अलावा, कुछ उपयोगकर्ताओं ने बड़े भाषा मॉडल (LLMs) का उपयोग करके कुछ असामान्य विषयों पर सामग्री लिखी है, जिसमें कवक, भोजन और खेल शामिल हैं, यहां तक कि अध्याय वार पुस्तक सारांश की सामग्री भी है।

शोध ने विकिपीडिया की AI जनित सामग्री की तुलना Reddit और संयुक्त राष्ट्र के समाचार पत्रों से की, और पाया कि Reddit पर AI जनित सामग्री विकिपीडिया की तुलना में काफी कम है, जो 1% से भी कम है। यह दर्शाता है कि Reddit पर AI जनित सामग्री या तो बहुत कम है, या इसे सेंसर किया गया है, या इसका पता लगाना मुश्किल है। जबकि संयुक्त राष्ट्र के AI जनित समाचार पत्रों में उल्लेखनीय वृद्धि हुई है, जो 2022 में 1% से कम से बढ़कर 2024 में 20% हो गया है।

रिपोर्ट के अंत में यह जोर दिया गया कि जनरेटिव LLMs के उदय के साथ, AI डिटेक्शन उपकरण भी लगातार विकसित हो रहे हैं। लेकिन विभिन्न पाठ की लंबाई, क्षेत्रों और मानव-मशीन एकीकरण जैसे विभिन्न संदर्भों में इन डिटेक्टर्स का मूल्यांकन करना अभी भी चुनौतियों का सामना कर रहा है।

AI जनित सामग्री की चुनौतियों का सामना करने के लिए, व्यक्तियों, शैक्षणिक संस्थानों, व्यवसायों और सरकारों को मानव निर्मित सामग्री को सत्यापित करने के लिए विश्वसनीय तरीकों की सक्रिय रूप से खोज करनी चाहिए। विभिन्न देशों के नियामक संस्थाओं को भी AI जनित सामग्री के प्रबंधन को मजबूत करना चाहिए। उदाहरण के लिए, चीन ने पहले से ही इंटरनेट पर AI जनित जानकारी की पारदर्शिता बढ़ाने के लिए कदम उठाना शुरू कर दिया है और संबंधित मसौदा नियम जारी किए हैं। जबकि भारत ने इस वर्ष AI संबंधित सामग्री के लेबलिंग के लिए सुझाव जारी किया है, हालांकि यह प्रस्ताव व्यापक विवाद और आलोचना का विषय बना है।

मुख्य बिंदु:
📊 अध्ययन से पता चलता है कि लगभग 4.36% विकिपीडिया के नए लेख AI जनित सामग्री हैं।
🔍 Reddit पर AI जनित सामग्री 1% से कम है, जो स्पष्ट अंतर दर्शाता है।
🌐 विभिन्न देश AI जनित सामग्री के लिए नियामक उपायों और लेबलिंग आवश्यकताओं की खोज कर रहे हैं।

वुहान का पहला मामला: एआई द्वारा उत्पन्न चित्र के Copyright मामले में जीत, सृजनकर्ता को मुआवजा मिला

चांगजियांग रॉब्लिक की रिपोर्ट के अनुसार, वुहान पूर्व झील हाई-टेक ज़ोन कोर्ट ने एक ध्यानाकर्षक कॉपीराइट विवाद का निपटारा किया, जो वुहान का पहला मामला है जिसमें कृत्रिम बुद्धिमत्ता द्वारा उत्पन्न चित्र शामिल है। इस मामले का मुख्य बिंदु यह था कि वांग (某) ने एआई उत्पन्न सामग्री के सृजनकर्ता के रूप में अपने कॉपीराइट की सफलतापूर्वक रक्षा की और 4000 युआन का आर्थिक मुआवजा प्राप्त किया। इस घटना की शुरुआत तब हुई जब वांग ने शियोहॉन्गशू प्लेटफार्म पर एक नोट पोस्ट किया जिसमें बताया गया था कि उन्होंने "某 एआई" ऐप का उपयोग करके चित्र कार्यों को बनाया। सांख्यिकी के अनुसार, इस नोट को व्यापक ध्यान मिला।

2023 में अंग्रेजी विकिपीडिया के सबसे लोकप्रिय पृष्ठ: ChatGPT शीर्ष पर

ChatGPT 2023 में अंग्रेजी विकिपीडिया के सबसे लोकप्रिय पृष्ठ बन गया, जिसमें 5 करोड़ दर्शक थे, जो टेलर स्विफ्ट और बार्बी से अधिक है। संपादक चिंतित हैं कि ChatGPT पाठकों की विश्वसनीयता को कम कर सकता है, यहाँ तक कि विकिपीडिया के भविष्य के चार या पांच वर्षों की स्थिरता के लिए खतरा पैदा कर सकता है। विकिपीडिया की 2023 की मृत सूची दूसरे सबसे लोकप्रिय पृष्ठ बन गई, जिसमें औसतन प्रति दिन 1.3 लाख क्लिक मिलते हैं, कुल दृश्य लगभग 4.3 करोड़ है। विकिपीडिया के संस्थापक जिमी वेल्स ने विकिपीडिया पर ChatGPT द्वारा लेखन को "खराब" और "अव्यवस्थित" बताते हुए सटीक और पूर्वाग्रह मुक्त लेखन का आग्रह किया।

विकिपीडिया के संस्थापक ने ChatGPT विकिपीडिया लेखन की आलोचना की

जिमी वेल्स ने ChatGPT द्वारा विकिपीडिया पर लिखने में त्रुटियों और फर्जी समाचारों की आलोचना की। वेल्स विकिपीडिया में AI की संभावित भूमिका के प्रति खुला रुख रखते हैं, और ओपन-सोर्स AI कंपनियों के साथ सहयोग पर विचार कर रहे हैं। मेटा द्वारा पेश किए गए PEER और साइड मॉडल ने विकिमीडिया के साथ सहयोग नहीं किया है, जिससे व्यापक चर्चा शुरू हुई है। आलोचना के बावजूद, विकिपीडिया क्षेत्र में कृत्रिम बुद्धिमत्ता की संभावित भूमिका की खोज जारी है, और ओपन-सोर्स AI कंपनियों के साथ सहयोग भविष्य के लिए संभावनाएँ प्रदान करता है।

विकिपीडिया के संस्थापक जिमी वेल्स ने ChatGPT पर विचार किया: वर्तमान चरण 'खराब', लेकिन 50 वर्षों में मानवता को पार कर सकता है

विकिपीडिया के संस्थापक जिमी वेल्स ने वर्तमान ChatGPT के प्रदर्शन पर कड़ा आलोचना की।超 मानव AI को लागू करने में कम से कम 50 वर्ष लग सकते हैं, जबकि वर्तमान में यह अधिकतर बौद्धिक गतिविधियों का समर्थन करने की संभावना है। वेल्स ने विकिपीडिया में AI के उपयोग की संभावना को खारिज नहीं किया, लेकिन गलतियों की पहचान और सुधार की आवश्यकता पर जोर दिया। विकिपीडिया जनरेटिव AI और पूर्वाग्रह की समस्याओं का सामना कर रहा है, विविधता पूर्वाग्रह से लड़ने की कुंजी है। विकिपीडिया मानवता के मूल पहलुओं में सही ढंग से कार्य करने की उम्मीद करता है, रोबोटों को पूर्वाग्रह सिखाने से बचना चाहता है।

AI समाचार

सामग्री गुणवत्ता चिंताजनक! अध्ययन से पता चलता है कि लगभग 5% विकिपीडिया सामग्री एआई द्वारा उत्पन्न है

AIbase基地

संबंधित AI समाचार अनुशंसाएँ

वुहान का पहला मामला: एआई द्वारा उत्पन्न चित्र के Copyright मामले में जीत, सृजनकर्ता को मुआवजा मिला

2023 में अंग्रेजी विकिपीडिया के सबसे लोकप्रिय पृष्ठ: ChatGPT शीर्ष पर

विकिपीडिया के संस्थापक ने ChatGPT विकिपीडिया लेखन की आलोचना की