OpenAI a publié les spécifications de son robot d'exploration web, GPTBot, précisant que les données collectées serviront à améliorer ses futurs modèles. Les éditeurs de sites web peuvent refuser de fournir du contenu, et une fois les données collectées, il est difficile de les supprimer des ensembles de données publiques. Certains sites web ont déjà pris des mesures pour bloquer le robot d'OpenAI, ce qui a suscité des discussions sur la confidentialité des données et la conformité.
Le concurrent d'OpenAI, Google, a proposé de repenser le fonctionnement des protocoles des robots d'exploration web afin de réduire les litiges concernant les droits sur les données. Globalement, cet article traite des spécifications du robot d'exploration web d'OpenAI et des questions juridiques et de confidentialité qui y sont liées.