हाल ही में, यूक्रेन की एक वेबसाइट Trilegangers, जो मानव शरीर के 3D मॉडल पर केंद्रित है, को अभूतपूर्व ट्रैफिक हमले का सामना करना पड़ा, जिससे उसके सर्वर ठप हो गए। यह वेबसाइट 3D कलाकारों और गेम डेवलपर्स को विशाल मानव शरीर के 3D मॉडल डेटा प्रदान करने के लिए समर्पित है, लेकिन OpenAI के वेब क्रॉलर GPTBot द्वारा बार-बार डेटा खींचे जाने के कारण संकट में पड़ गई।

Trilegangers के कर्मचारियों के अनुसार, हालांकि वेबसाइट के उपयोग की शर्तों में बिना अनुमति के डेटा खींचने और उपयोग करने पर स्पष्ट रूप से प्रतिबंध लगाया गया है, लेकिन robots.txt फ़ाइल को सही ढंग से सेट नहीं करने के कारण क्रॉलर की पहुंच को रोकने में असफल रहे, जिससे अंततः सर्वर पर भार अधिक हो गया। सर्वर लॉग के अनुसार, OpenAI के GPTBot क्रॉलर ने 600 से अधिक विभिन्न आईपी पते के माध्यम से हजारों अनुरोध किए, जिसके परिणामस्वरूप वेबसाइट सामान्य रूप से कार्य करने में असमर्थ रही, जैसे कि इसे वितरित अस्वीकृति सेवा (DDoS) हमले का सामना करना पड़ा।

image.png

OpenAI ने अपने क्रॉलर विवरण में उल्लेख किया है कि यदि वेबसाइट GPTBot से सामग्री खींचना नहीं चाहती है, तो उसे robots.txt फ़ाइल में सेटिंग करनी होगी। हालांकि, Trilegangers ने इस बात का एहसास नहीं किया, जिससे वर्तमान संकट उत्पन्न हुआ। हालांकि robots.txt फ़ाइल कानूनी रूप से आवश्यक नहीं है, यदि वेबसाइट पहले से ही बिना अनुमति के उपयोग पर प्रतिबंध लगाती है, तो GPTBot का डेटा खींचना संबंधित नियमों का उल्लंघन कर सकता है।

इसके अलावा, अमेज़न AWS सर्वर का उपयोग करने के कारण, Trilegangers के बैंडविड्थ और ट्रैफिक की खपत में भी तेज़ी से वृद्धि हुई, जिससे उसे अतिरिक्त लागत का दबाव झेलना पड़ा। इस अचानक घटना का सामना करने के लिए, Trilegangers ने सही robots.txt फ़ाइल सेट की है और Cloudflare के माध्यम से GPTBot सहित कई क्रॉलरों की पहुंच को अवरुद्ध किया है, यह उपाय सर्वर के भार को प्रभावी ढंग से कम करने और वेबसाइट के सामान्य संचालन को सुनिश्चित करने की उम्मीद है।

यह घटना इंटरनेट क्रॉलिंग व्यवहार पर लोगों का ध्यान आकर्षित करती है, विशेष रूप से जब AI तकनीक तेजी से विकसित हो रही है, तकनीकी उपयोग और कॉपीराइट संरक्षण के बीच संतुलन कैसे बनाया जाए, यह एक विचार करने योग्य विषय बन गया है।