Une étude a révélé que près de la moitié des sites d'actualités populaires bloquent le crawler d'OpenAI. Les sites web de médias imprimés traditionnels sont plus susceptibles de bloquer le crawler d'OpenAI, tandis que les nouveaux modèles d'intelligence artificielle peuvent subir une régression lorsqu'ils sont entraînés à l'aide de modèles précédents. Les crawlers d'IA sont utilisés pour collecter des données pour entraîner des modèles linguistiques, et les agences de presse de l'hémisphère nord sont plus susceptibles de bloquer les crawlers d'IA.