Reddit hat kürzlich angekündigt, seine Datenschutzmaßnahmen zu verstärken und zielt dabei direkt auf KI-Unternehmen und andere Daten-Scraping-Tools ab. Dieser Schritt kennzeichnet die zunehmend angespannten Beziehungen zwischen Social-Media-Plattformen und der KI-Industrie.
Reddit plant, seine Robots.txt-Datei zu aktualisieren, um das nicht autorisierte automatisierte Crawling durch Plattformen zu verhindern. Ein Unternehmenssprecher betonte, dass diese Aktualisierung nicht auf bestimmte Unternehmen abzielt, sondern darauf ausgerichtet ist, „Reddit zu schützen und gleichzeitig das offene Internet zu erhalten“. Reddit erklärte, dass diese Änderungen „gutgläubige Akteure“ wie das Internet Archive und Forscher nicht beeinträchtigen werden.
Bildquelle: Das Bild wurde mit KI generiert, Bildlizenzgeber: Midjourney
Dieser Schritt scheint eine Reaktion auf aktuelle Berichte zu sein, wonach KI-Unternehmen wie Perplexity die Robots.txt-Vereinbarung umgehen. Der CEO von Perplexity bezeichnete diese Vereinbarung in einem Interview mit dem „Fast Company“-Magazin als „keinen Rechtsrahmen“, was zu Kontroversen über das Datenbeschaffungsverfahren von KI-Unternehmen führte.
Reddits Position ist klar: Jedes Unternehmen, das automatisierte Proxys verwendet, um auf seine Plattform zuzugreifen, muss seine Bedingungen und Richtlinien einhalten und mit Reddit kommunizieren. Dies könnte darauf hindeuten, dass Reddit ähnliche Lizenzvereinbarungen mit KI-Unternehmen wie die bestehenden mit Google und OpenAI anstrebt.
Dies ist nicht das erste Mal, dass Reddit in Bezug auf Datenzugriff eine harte Haltung einnimmt. Im vergangenen Jahr begann das Unternehmen, KI-Unternehmen für die Nutzung seiner API-Schnittstelle zu berechnen und schloss Lizenzvereinbarungen mit einigen KI-Unternehmen ab, die es ihnen ermöglichten, Reddits Daten zum Trainieren von Modellen zu verwenden. Diese Vereinbarungen sind zu einer wichtigen Einnahmequelle für Reddit geworden.
Reddits Vorgehen spiegelt den Spagat zwischen dem Schutz von nutzergenerierten Inhalten und der Suche nach neuen Einnahmemodellen wider. Angesichts der rasanten Entwicklung der KI-Technologie könnten ähnliche Streitigkeiten über den Datenzugriff auf anderen Plattformen auftreten und eine breitere Diskussion über Fragen des Datenbesitzes, der Nutzungsrechte und der Wertverteilung auslösen.