कॉपीलीक्स नामक प्लेजियरी डिटेक्शन कंपनी ने हाल ही में एक रिपोर्ट जारी की है जिसमें बताया गया है कि OpenAI द्वारा पेश किए गए GPT-3.5 बड़े भाषा मॉडल द्वारा उत्पन्न सामग्री में से 60% से अधिक में विभिन्न प्रकार की नकल मौजूद है। कॉपीलीक्स ने अपनी स्वयं विकसित स्कोरिंग विधि का उपयोग किया है, जो पाठ समानता, छोटे परिवर्तनों, व्याख्या आदि जैसे कई कारकों पर विचार करके समान सामग्री को "नकल" के रूप में निर्धारित करता है। कंप्यूटर विज्ञान, भौतिकी, मनोविज्ञान आदि विषयों में समानता सबसे अधिक है, जबकि नाटक, मानविकी और अंग्रेजी में समानता कम है। OpenAI ने कहा है कि उसने अनजाने में स्मृति को सीमित करने के लिए विभिन्न उपाय किए हैं, और उपयोग की शर्तों में स्पष्ट रूप से यह निषिद्ध है कि उपयोगकर्ता जानबूझकर मॉडल को सामग्री की नकल करने के लिए प्रेरित करें। इसके अलावा, न्यूयॉर्क टाइम्स द्वारा उठाए गए प्रसिद्ध मुकदमे के अलावा, कुछ सामग्री निर्माता यह भी दावा करने की कोशिश कर रहे हैं कि एआई मॉडल उनके कार्यों पर प्रशिक्षित हुआ है, इसलिए निकटता की नकल सामग्री के लिए भी उन्हें हिस्सेदारी दी जानी चाहिए।