Mercredi, Cloudflare a offert à ses clients d'hébergement de sites web un moyen d'empêcher les robots IA de récupérer le contenu de leurs sites et d'utiliser les données sans autorisation pour entraîner des modèles d'apprentissage automatique.

Cela fait suite aux préoccupations des clients concernant les robots IA, et l'entreprise a déclaré dans un communiqué qu'elle souhaitait contribuer à protéger la sécurité des créateurs de contenu sur Internet.

Recherche Web

Source de l'image : Image générée par IA, fournie par Midjourney

« Nous avons clairement entendu nos clients qui ne souhaitent pas que les robots IA accèdent à leurs sites web, en particulier ceux qui le font de manière malhonnête. Pour les aider, nous avons ajouté une toute nouvelle fonctionnalité permettant de bloquer tous les robots IA en un seul clic. »

Pour les propriétaires de sites web, il existe déjà une méthode relativement efficace pour bloquer les robots, à savoir le fichier robots.txt largement disponible. Lorsqu'il est placé à la racine d'un site web, les robots d'indexation automatique devraient le remarquer et respecter les instructions qui leur interdisent d'accéder à certaines parties du site.

Étant donné que l'IA générative est généralement considérée comme une source de vol, et que de nombreuses poursuites judiciaires tentent de tenir les entreprises d'IA responsables, les entreprises qui « nettoient » le contenu offrent généreusement aux éditeurs web le choix de ne pas participer à ce vol.

En août dernier, OpenAI a publié des instructions sur la manière d'utiliser les directives robots.txt pour bloquer son robot d'indexation GPTbot, probablement en raison des préoccupations concernant l'utilisation non autorisée du contenu pour l'entraînement de l'IA. Google a pris des mesures similaires le mois suivant. En septembre dernier également, Cloudflare a commencé à proposer un moyen de bloquer les robots IA respectueux des règles, et 85 % des clients auraient activé cette fonctionnalité.

Points clés :

⭐️ Cloudflare lance une fonctionnalité de blocage en un clic des robots d'indexation IA, afin de garantir que le contenu des sites web ne soit pas utilisé par des robots IA sans autorisation.

⭐️ L'IA générative est considérée comme une source de vol, et de nombreuses entreprises prennent des mesures pour empêcher les robots IA d'utiliser le contenu sans autorisation.

⭐️ Cloudflare utilise des modèles d'apprentissage automatique pour identifier et bloquer les robots d'indexation déguisés, protégeant ainsi les droits des créateurs de contenu sur Internet.