Cloudflare ofreció el miércoles a sus clientes de alojamiento web una forma de bloquear a los robots de IA que rastrean el contenido de los sitios web y utilizan los datos sin permiso para entrenar modelos de aprendizaje automático.

Esto se basa en las preocupaciones de los clientes sobre los robots de IA y, según una declaración de la compañía, busca ayudar a proteger la seguridad de los creadores de contenido en Internet.

Búsqueda Web

Nota de la fuente de la imagen: Imagen generada por IA, proveedor de servicios de licencia de imágenes Midjourney

“Hemos escuchado claramente a nuestros clientes que no quieren que los robots de IA accedan a sus sitios web, especialmente aquellos que lo hacen de manera deshonesta. Para ayudar, hemos agregado una nueva función de bloqueo de un solo clic para todos los robots de IA”.

Para los propietarios de sitios web, ya existe un método relativamente efectivo para bloquear a los robots: el archivo robots.txt, ampliamente disponible. Cuando se coloca en el directorio raíz de un sitio web, los rastreadores web automáticos deberían notarlo y cumplir las instrucciones que les indican que no entren.

Dado el consenso generalizado de que la IA generativa se basa en el robo, y con muchas demandas legales que intentan responsabilizar a las empresas de IA, las empresas que “limpian” el contenido están dando generosamente a los publicadores web la opción de no participar en el robo.

En agosto del año pasado, OpenAI publicó una guía sobre cómo usar las instrucciones de robots.txt para bloquear su rastreador web GPTbot, posiblemente debido a la preocupación por el rastreo no autorizado de contenido y su uso en el entrenamiento de IA sin consentimiento. Google tomó medidas similares el mes siguiente. También en septiembre del año pasado, Cloudflare comenzó a ofrecer una forma de bloquear a los robots de IA que cumplen con las reglas, y según se informa, el 85% de los clientes habilitaron esta función de bloqueo.

Puntos clave:

⭐️ Cloudflare lanza una función de bloqueo de un solo clic para los rastreadores web de IA, asegurando que el contenido del sitio web no sea utilizado por robots de IA sin autorización.

⭐️ La IA generativa se considera una fuente de robo, y las grandes empresas están tomando medidas para evitar que los robots de IA usen contenido sin autorización.

⭐️ Cloudflare utiliza modelos de aprendizaje automático para identificar y bloquear rastreadores web disfrazados, protegiendo los derechos de los creadores de contenido en Internet.