Medios internacionales han revelado que el proyecto de modelo lingüístico grande de ByteDance, "Proyecto Semilla", utilizó datos del modelo GPT durante su desarrollo inicial, violando los términos de servicio de OpenAI. OpenAI posteriormente declaró haber suspendido las cuentas relacionadas con ByteDance. ByteDance niega haber cometido ninguna infracción y afirma estar en comunicación activa con OpenAI para aclarar los malentendidos. El incidente refleja que las normas de uso y la regulación de los datos de entrenamiento en el campo de los modelos lingüísticos grandes aún son objeto de controversia.