AI企業のクローラーによる混乱、ウェブサイトのブロック努力は徒労に終わる

AIbase基地

公開日AIニュース · 1 分で読めます · Jul 30, 2024

174

最近の調査で、数百ものウェブサイトがAI企業Anthropicによるコンテンツのスクレイピングを阻止しようとしていたものの、古い指示を使用していたために間違ったボットをブロックしていたことが判明しました。この現象は、変化の激しいAIクローラーのエコシステムに対応する上で、ウェブサイト所有者が直面する困難さを浮き彫りにしています。

ウェブクローラーを追跡するウェブサイトDark Visitorsの匿名運営者によると、多くのウェブサイトがAnthropic社が既に使用していない2つのボット「ANTHROPIC-AI」と「CLAUDE-WEB」をブロックしており、一方、同社の新しいクローラー「CLAUDEBOT」は知らないうちにアクセスを許可しているとのことです。これは、ウェブサイト所有者が古い指示をrobots.txtファイルにコピー＆ペーストし、AI企業が新しい名前のクローラーを次々と導入していることが主な原因です。

データ分析株価

画像出典：AI生成、画像ライセンス提供元Midjourney

この混乱はAnthropicに限ったことではありません。Dark Visitorsの運営者は、AppleやMetaなどのテクノロジー大手も最近新しいプロキシを追加しており、ウェブサイト所有者が手動でこれらの変化に対応することがほぼ不可能になっていると指摘しています。さらに懸念されるのは、一部のAI企業が、スクレイピングすべきでないウェブサイトを隠密裏にスクレイピングしたり、robots.txtファイルの指示を完全に無視したりしていることです。

この状況は様々な問題を引き起こしています。一部のウェブサイトはクローラーを完全にブロックしたり、特定のクローラーのみを許可したりするようになり、これは検索エンジンのインデックス、インターネットアーカイブ、学術研究に影響を与える可能性があります。同時に、一部のウェブサイトは、AIクローラーによる大規模なアクセスによる技術的および経済的な圧力に直面しています。例えば、修理マニュアルサイトのiFixitは、Anthropicのクローラーが1日に約100万回もウェブサイトにアクセスしたと報告しています。また、別のサービスプロバイダーであるRead the Docsは、あるクローラーが1日に10TBのファイルにアクセスし、高額な帯域費用が発生したと述べています。

データソースイニシアチブ（Data Provenance Initiative）の調査では、コンテンツ制作者とウェブサイト所有者がAIツールのトレーニングを阻止しようとする際に直面する普遍的な混乱がさらに明らかになっています。この調査では、AIスクレイピングツールを阻止する責任は完全にウェブサイト所有者にあると指摘しており、クローラー数の増加と頻繁な変化によって、このタスクは非常に困難になっています。

この複雑な状況に対処するため、専門家はウェブサイト管理者に対し、存在しないプロキシを誤ってブロックする可能性があっても、疑わしいAIクローラーを積極的にブロックするよう推奨しています。同時に、制限のないスクレイピングを防ぐために、より多くの制作者がコンテンツを有料の壁の後ろに移行すると予測する声もあります。

ハードウェア開発せず！Anthropic CPO、企業向け汎用基盤モデル開発に注力と発表

先日開催されたHuman[X]カンファレンスにおいて、AIスタートアップAnthropicの最高製品責任者マイク・クリーガー(Mike Krieger)氏は、同社がハードウェアやコンシューマーエンターテイメント分野に進出する計画はないと明かし、企業向けの汎用基盤モデル開発に注力していくと発表しました。Claude AIの開発者であるAnthropicは、アマゾンとグーグルから支援を受けており、様々な業界に実用的なAIソリューションを提供することを目指しています。クリーガー氏によると、Ant…

マイクロソフト、南アフリカに人工知能インフラ構築のため2億9800万ドル投資

テクノロジー大手マイクロソフトは先日、人工知能とデータセンターのインフラ整備のために南アフリカに2億9800万ドルを投資すると発表しました。この取り組みは、南アフリカのデジタル経済発展を促進し、地元企業や個人により良い技術サポートとサービスを提供することを目的としています。世界的な人工知能需要の高まりを受け、マイクロソフトの投資は南アフリカのこの分野における競争力強化に貢献するでしょう。マイクロソフトの投資計画には、資金投入だけでなく、技術導入と人材育成も含まれています。地元企業や教育機関との連携を通じて、マイクロソフトは南アフリカで…

報道：アリババ、2025年末までに全販売業者へのAIツール導入目指す

サウスチャイナ・モーニング・ポストの報道によると、アリババ国際卸売市場の社長である張闊氏は最近のインタビューで、アリババが人工知能（AI）技術の導入を推進しており、2025年末までに全販売業者へのAIツール導入を目指していると述べました。現在、約20万人の販売業者のうち、半数以上がアリババが提供するAIアプリケーションを毎週利用しています。これらのAIツールは2024年初頭に導入され、販売業者のマーケティング、製品管理、顧客とのやり取り、リスク管理を支援することを目的としています。これらの施策はアリババ...

米国司法省、グーグルにChromeブラウザ売却とAI投資制限緩和を要求

米国司法省は最新の裁判書類で、グーグルに対し、ウェブブラウザChromeの売却を依然として求めている。この提案はバイデン前大統領が昨年最初に提案したもので、司法省はトランプ政権下でもこの計画を維持していた。しかし、司法省は、Anthropicへの数十億ドルの投資を含む、グーグルのAI投資の全面的分離はもはや求めていない。司法省は裁判書類で、「グーグルの違法行為は経済的な巨額損失をもたらし、市場に深刻な影響を与えた。グーグルがどのような事態になっても…」と述べている。