Des médias ont révélé que le projet de modèle linguistique de grande envergure de ByteDance, baptisé « Seed Project », avait utilisé des données du modèle GPT lors de son développement précoce, en violation des conditions d'utilisation d'OpenAI. OpenAI a ensuite annoncé avoir suspendu les comptes liés à ByteDance. ByteDance a nié toute infraction, affirmant être en communication active avec OpenAI pour clarifier les malentendus. Cet événement met en lumière le fait que les règles d'utilisation et la réglementation des données d'entraînement dans le domaine des grands modèles linguistiques restent controversées.