Recentemente, o site ucraniano Trilegangers, especializado em modelos 3D do corpo humano, sofreu um ataque de tráfego sem precedentes, levando à paralisação de seus servidores. O site se dedica a fornecer uma grande quantidade de dados de modelos 3D do corpo humano para artistas 3D e desenvolvedores de jogos, mas foi afetado pelas frequentes capturas do robô GPTBot da OpenAI.

De acordo com funcionários do Trilegangers, apesar de o site ter explicitamente proibido a captura e o uso não autorizados em seus termos de uso, a falta de configuração correta do arquivo robots.txt para bloquear o acesso do robô resultou em uma sobrecarga do servidor. Os logs do servidor mostram que o robô GPTBot da OpenAI fez dezenas de milhares de solicitações a partir de mais de 600 endereços IP diferentes, tornando o site inacessível, semelhante a um ataque distribuído de negação de serviço (DDoS).

image.png

A OpenAI menciona em suas instruções de robô que, se um site não deseja que o GPTBot capture seu conteúdo, ele deve configurar o arquivo robots.txt. No entanto, o Trilegangers não percebeu isso, levando à situação atual. Embora o arquivo robots.txt não seja legalmente obrigatório, a captura pelo GPTBot pode violar as regras se o site já declarou a proibição de uso não autorizado.

Além disso, usando servidores AWS da Amazon, o Trilegangers experimentou um aumento acentuado no consumo de largura de banda e tráfego, resultando em custos adicionais. Para lidar com essa situação inesperada, o Trilegangers já tomou medidas, configurando o arquivo robots.txt corretamente e bloqueando o acesso de vários robôs, incluindo o GPTBot, por meio do Cloudflare. Essa medida deve aliviar a carga do servidor e garantir o funcionamento normal do site.

Este incidente destaca a preocupação com o comportamento dos robôs de busca na web, especialmente no contexto do desenvolvimento da IA. Como equilibrar o uso da tecnologia e a proteção de direitos autorais é uma questão que merece reflexão.