Das weltweit bekannte Unternehmen für Netzwerkinfrastruktur, Cloudflare, hat kürzlich ein neues Tool namens „AI Labyrinth“ (AI-Labyrinth) vorgestellt, um unerlaubte Webcrawler, die Website-Daten abrufen, zu bekämpfen. Die Kernidee besteht darin, dass das Tool, sobald Cloudflare unangemessenes Crawler-Verhalten feststellt, diese Crawler auf eine Reihe von KI-generierten, gefälschten Seiten leitet, um die Ressourcen der böswilligen Crawler zu „verzögern, verwirren und verschwenden“.

QQ_1742780352546.png

Website-Administratoren verlassen sich seit langem auf „robots.txt“-Dateien, um den Zugriff von Crawlern zu verwalten. Viele KI-Unternehmen, darunter bekannte Unternehmen wie Anthropic und Perplexity AI, ignorieren diese Regel jedoch häufig. Cloudflare gibt an, täglich über 50 Milliarden Crawler-Anfragen zu erhalten. Obwohl sie in der Lage sind, böswillige Anfragen zu erkennen und zu blockieren, führt dies oft dazu, dass Angreifer ihre Strategien ständig anpassen, was zu einem unaufhörlichen „Wettrüsten“ führt.

Anstatt diese Crawler einfach zu blockieren, greift Cloudflare mit dem AI Labyrinth aktiv ein. Das Tool ist so konzipiert, dass Crawler Informationen verarbeiten müssen, die nichts mit den Daten der Zielwebsite zu tun haben, wodurch sie in falschen Informationen gefangen werden. Cloudflare betont, dass das AI Labyrinth nicht nur ein „Köder der nächsten Generation“ ist, sondern auch dazu beiträgt, böswillige Crawler zu identifizieren und neue Crawler-Muster und -Merkmale zu erkennen. Diese Links sind für normale Benutzer unsichtbar, um Störungen zu vermeiden.

Laut Cloudflare können Website-Administratoren über den Bereich „Crawler-Management“ in ihrem Cloudflare-Dashboard auswählen, ob AI Labyrinth aktiviert werden soll. Die Einführung dieser neuen Funktion ist nur der erste Schritt bei der Bekämpfung von Crawlern mit generativer KI. Cloudflare plant außerdem, ein „ganzes Netzwerk von Link-URLs“ aufzubauen, um es Crawlern schwerer zu machen, gefälschte Daten zu erkennen. Es ist erwähnenswert, dass AI Labyrinth dem Nepenthes-Tool ähnelt, das entwickelt wurde, um Crawler monatelang in einer großen Menge an KI-generierten Mülldaten zu „verzögern“.

Offizieller Blog: https://blog.cloudflare.com/ai-labyrinth/

Wichtigste Punkte:

🕷️ Cloudflare stellt „AI Labyrinth“ zur Bekämpfung böswilliger Webcrawler vor, die Daten abrufen.

🔗 Das neue Tool leitet Crawler mithilfe von KI-generierten gefälschten Seiten in nutzlose Informationen, um deren Ressourcen zu verschwenden.

💡 Website-Administratoren können diese Funktion im Cloudflare-Dashboard aktivieren. Zukünftig wird es zu einem komplexeren Link-Netzwerk erweitert.