Une étude a révélé que près de la moitié des sites d'actualités populaires bloquent le crawler d'OpenAI. Les sites web de médias imprimés traditionnels sont plus susceptibles de bloquer le crawler d'OpenAI, tandis que les nouveaux modèles d'intelligence artificielle peuvent subir une régression lorsqu'ils sont entraînés à l'aide de modèles précédents. Les crawlers d'IA sont utilisés pour collecter des données pour entraîner des modèles linguistiques, et les agences de presse de l'hémisphère nord sont plus susceptibles de bloquer les crawlers d'IA.
Étude : les principaux sites d'actualités bloquent les robots d'exploration d'OpenAI

IT之家
51
© Tous droits réservés AIbase基地 2024, cliquez pour voir la source -https://www.aibase.com/fr/news/5737