Um relatório recente da Copyleaks, empresa de detecção de plágio, indica que até 60% do conteúdo gerado pelo modelo de linguagem de grande porte GPT-3.5, da OpenAI, contém algum tipo de plágio. A Copyleaks utiliza uma metodologia de pontuação própria, considerando diversos fatores como similaridade textual, pequenas alterações e paráfrases, para classificar conteúdo semelhante como "plágio". A maior similaridade foi encontrada em disciplinas como Ciência da Computação, Física e Psicologia, enquanto áreas como Teatro, Humanidades e Inglês apresentaram menor índice de similaridade. A OpenAI afirma ter implementado diversas medidas para limitar a memorização involuntária e seus termos de uso proíbem explicitamente o uso do modelo para gerar conteúdo por meio de engenharia reversa. Além disso, além do processo judicial conhecido envolvendo o New York Times, alguns criadores de conteúdo estão tentando argumentar que os modelos de IA foram treinados em suas obras e, portanto, merecem royalties pela produção de conteúdo similar.
Saída do modelo GPT-3.5 apresenta até 60% de plágio
