De acordo com a revista Wired, a Amazon Web Services (AWS) está investigando a Perplexity AI, uma startup de busca por inteligência artificial, por suposta violação dos termos de serviço da AWS, coletando conteúdo de sites que tentavam impedir isso.

A Perplexity AI, uma startup apoiada pelo fundo da família de Jeff Bezos e pela Nvidia, recentemente avaliada em US$ 3 bilhões, parece, segundo a Wired, depender da coleta de conteúdo de sites que são proibidos de acesso pelo protocolo Robots.txt. O Robots.txt é um padrão da web que indica quais páginas não devem ser acessadas por robôs e rastreadores automáticos. Embora não seja legalmente vinculativo, a maioria das empresas tradicionalmente o respeita.

AWS, Amazon, serviços em nuvem, Amazon, computação em nuvem, servidores

Um porta-voz da AWS afirmou que os termos de serviço da empresa proíbem os clientes de usar seus serviços para qualquer atividade ilegal, e que os clientes são responsáveis por cumprir os termos e todas as leis aplicáveis. Os clientes da AWS devem respeitar o padrão robots.txt ao rastrear sites.

A investigação descobriu que a Perplexity pode acessar um servidor usando endereços IP não divulgados, que acessou ativos da Condé Nast centenas de vezes nos últimos três meses, aparentemente para coletar conteúdo proibido. Porta-vozes do The Guardian, Forbes e The New York Times também relataram ter detectado situações semelhantes.

Aravind Srinivas, CEO da Perplexity, disse que a coleta detectada foi feita por uma empresa terceirizada que fornece serviços de coleta e indexação na web, mas se recusou a divulgar o nome da empresa. Sara Platnick, porta-voz da Perplexity, disse que a empresa respondeu às perguntas da Amazon e afirmou que seu PerplexityBot respeita o robots.txt, mas o ignora quando um usuário insere um URL específico.

Jason Kint, CEO da Digital Content Next, uma associação comercial do setor de conteúdo digital, acredita que, se as acusações contra a Perplexity forem verdadeiras, a empresa violou vários princípios para evitar potenciais violações de direitos autorais. Ele enfatizou que as empresas de inteligência artificial não devem, por padrão, obter e usar o conteúdo dos editores sem permissão.

Atualmente, este incidente gerou grande atenção e discussão sobre a forma como as empresas de IA obtêm dados. O setor aguarda a divulgação dos resultados da investigação da AWS e as possíveis medidas que serão tomadas contra a Perplexity.