Um relatório recente da Copyleaks, empresa de detecção de plágio, indica que até 60% do conteúdo gerado pelo modelo de linguagem de grande porte GPT-3.5, da OpenAI, contém algum tipo de plágio. A Copyleaks utiliza uma metodologia de pontuação própria, considerando diversos fatores como similaridade textual, pequenas alterações e paráfrases, para classificar conteúdo semelhante como "plágio". A maior similaridade foi encontrada em disciplinas como Ciência da Computação, Física e Psicologia, enquanto áreas como Teatro, Humanidades e Inglês apresentaram menor índice de similaridade. A OpenAI afirma ter implementado diversas medidas para limitar a memorização involuntária e seus termos de uso proíbem explicitamente o uso do modelo para gerar conteúdo por meio de engenharia reversa. Além disso, além do processo judicial conhecido envolvendo o New York Times, alguns criadores de conteúdo estão tentando argumentar que os modelos de IA foram treinados em suas obras e, portanto, merecem royalties pela produção de conteúdo similar.