据《连线》杂志报道,亚马逊网络服务(AWS)正在对人工智能搜索初创公司Perplexity AI进行调查,原因是该公司涉嫌违反AWS服务条款,抓取了试图阻止其这样做的网站内容。

Perplexity AI是一家由杰夫·贝佐斯家族基金和Nvidia支持的初创公司,最近估值达30亿美元。《连线》杂志发现,该公司似乎依赖于抓取通过Robots排除协议禁止访问的网站内容。Robots排除协议是一项网络标准,用于指示哪些页面不应被自动机器人和爬虫访问。虽然该协议不具有法律约束力,但大多数公司传统上都会遵守。

AWS,亚马逊,云服务,Amazon,云计算,服务器

AWS发言人表示,公司服务条款禁止客户使用其服务进行任何非法活动,客户有责任遵守条款和所有适用法律。AWS客户在爬取网站时必须遵守robots.txt标准。

调查发现,Perplexity可以使用未公开的IP地址访问一台服务器,该服务器在过去三个月内至少访问了康泰纳仕旗下的资产数百次,显然是为了抓取被禁止访问的内容。《卫报》、《福布斯》和《纽约时报》的发言人也表示检测到类似情况。

Perplexity首席执行官Aravind Srinivas称,被发现的抓取行为是由一家提供网络抓取和索引服务的第三方公司进行的,但拒绝透露该公司名称。Perplexity发言人Sara Platnick表示,公司已回应亚马逊的询问,并称其PerplexityBot尊重robots.txt,但在用户输入特定URL时会忽略该协议。

数字内容行业贸易协会Digital Content Next的首席执行官Jason Kint认为,如果针对Perplexity的指控属实,该公司就违反了防止潜在版权侵权的多项原则。他强调,人工智能公司默认不应未经许可获取和使用出版商的内容。

目前,这起事件引发了对AI公司数据获取方式的广泛关注和讨论。业界期待AWS调查结果的公布,以及可能对Perplexity采取的进一步行动。