Un informe reciente de la empresa de detección de plagio Copyleaks indica que hasta un 60% del contenido generado por el modelo de lenguaje grande GPT-3.5 de OpenAI contiene algún tipo de plagio. Copyleaks utiliza un método de puntuación propio que considera varios factores, como la similitud textual, los cambios menores y las paráfrasis, para determinar si un contenido es "plagio". Las disciplinas con mayor similitud fueron informática, física y psicología, mientras que el teatro, las humanidades y la lengua inglesa mostraron una similitud menor. OpenAI afirma haber implementado diversas medidas para limitar la memorización involuntaria, y sus términos de servicio prohíben explícitamente que los usuarios intenten que el modelo reproduzca contenido de forma deliberada. Además de la conocida demanda presentada por el New York Times, algunos creadores de contenido intentan argumentar que los modelos de IA se entrenaron con sus obras, por lo que deberían recibir una parte de las ganancias por la producción de contenido similar.
La salida del modelo GPT-3.5 muestra hasta un 60% de plagio
