Na quarta-feira, a Cloudflare ofereceu aos clientes de hospedagem de sites uma maneira de impedir que robôs de IA rastreiem o conteúdo do site e usem os dados para treinar modelos de aprendizado de máquina sem permissão.
Isso se baseia na aversão dos clientes a robôs de IA e, para ajudar a proteger os criadores de conteúdo na internet, disse a empresa em um comunicado.
Observação da imagem: Imagem gerada por IA, provedor de serviços de licenciamento de imagens Midjourney
“Ouvimos claramente nossos clientes que não querem que robôs de IA acessem seus sites, especialmente aqueles que o fazem de forma desonesta. Para ajudar, adicionamos um novo recurso de bloqueio de um clique para todos os robôs de IA.”
Para os proprietários de sites, já existe um método relativamente eficaz para bloquear robôs: o arquivo robots.txt amplamente disponível. Quando colocado na raiz do site, os rastreadores da web automatizados devem notar e obedecer às instruções do arquivo que dizem a eles para não entrar.
Considerando a crença generalizada de que a IA generativa é baseada em roubo e com muitos processos judiciais tentando responsabilizar as empresas de IA, as empresas que “lavam” conteúdo estão dando generosamente aos publicadores online a opção de não participar do roubo.
Em agosto passado, a OpenAI lançou diretrizes sobre como usar as instruções robots.txt para bloquear seu rastreador web GPTbot, possivelmente por causa da preocupação com o conteúdo sendo raspado e usado para treinamento de IA sem consentimento. O Google tomou medidas semelhantes no mês seguinte. Também em setembro passado, a Cloudflare começou a oferecer uma maneira de bloquear robôs de IA que seguem as regras, com um alegado 85% dos clientes habilitando esse bloqueio.
Destaques:
⭐️ A Cloudflare lançou um recurso de bloqueio de um clique para rastreadores web de IA, garantindo que o conteúdo do site não seja usado por robôs de IA sem permissão.
⭐️ A IA generativa é vista como uma fonte de roubo, e várias empresas estão tomando medidas para impedir que robôs de IA usem conteúdo sem autorização.
⭐️ A Cloudflare usa modelos de aprendizado de máquina para identificar e bloquear rastreadores web disfarçados, protegendo os direitos dos criadores de conteúdo na internet.