Kürzlich haben die New York Times und die Daily News gemeinsam Klage gegen OpenAI eingereicht. Sie werfen dem Unternehmen vor, ihre Werke ohne Genehmigung zum Trainieren von KI-Modellen verwendet zu haben.

Der Fall hat die Öffentlichkeit in Aufruhr versetzt, da die Anwälte der Kläger in aktuellen Gerichtsdokumenten darlegen, dass OpenAI-Ingenieure versehentlich Beweise gelöscht haben, die für den Fall von Bedeutung sein könnten.

Copyright

OpenAI hatte im Herbst zugestimmt, zwei virtuelle Maschinen bereitzustellen, damit die Anwälte der Kläger ihre Trainingsdaten auf urheberrechtlich geschützte Inhalte durchsuchen konnten. Virtuelle Maschinen sind innerhalb eines Computer-Betriebssystems laufende virtuelle Computer, die oft für Tests, Datensicherung und die Ausführung von Anwendungen verwendet werden. Seit dem 1. November haben die Rechtsberater der New York Times und der Daily News sowie ihre beauftragten Experten über 150 Stunden an den Trainingsdaten von OpenAI gearbeitet.

Am 14. November löschten OpenAI-Ingenieure jedoch versehentlich die auf einer der virtuellen Maschinen gespeicherten Suchdaten. Laut Schreiben der Anwälte der Kläger konnte OpenAI die Daten zwar größtenteils wiederherstellen, doch aufgrund der „nicht wiederherstellbaren“ Ordnerstruktur und Dateinamen konnten die wiederhergestellten Daten nicht dazu verwendet werden, festzustellen, wie die Artikel der Kläger zum Trainieren des OpenAI-Modells verwendet wurden.

Die Rechtsberater der Kläger gaben an, sie gingen nicht von einer bewussten Löschung aus, aber der Vorfall zeige, dass OpenAI „am besten geeignet ist, seine eigenen Datensätze nach potenziellen Urheberrechtsverletzungen zu durchsuchen“. Das bedeute, OpenAI sollte seine eigenen Tools nutzen, um relevante Urheberrechtsverletzungen effizienter zu finden.

OpenAI behauptet in diesem und ähnlichen Fällen stets, die Verwendung öffentlich zugänglicher Daten zum Trainieren von Modellen sei eine zulässige Nutzung („fair use“). Das bedeutet, OpenAI ist der Ansicht, dass es keine Urheberrechtsgebühren für die Verwendung dieser Beispiele zahlen muss, obwohl es aus diesen Modellen Gewinn zieht.

Bemerkenswert ist, dass OpenAI mit immer mehr Nachrichtenagenturen Lizenzverträge abgeschlossen hat, darunter die Associated Press, Business Insider und die Financial Times. Die genauen Vertragsbedingungen wurden von OpenAI jedoch nicht veröffentlicht. Angeblich erhält der Content-Partner Dotdash jährlich mindestens 16 Millionen US-Dollar.

Trotz der rechtlichen Auseinandersetzungen bestätigt oder dementiert OpenAI nicht, ob bestimmte urheberrechtlich geschützte Werke ohne Genehmigung zum KI-Training verwendet wurden.

Wichtigste Punkte:

🌐 OpenAI wird vorgeworfen, in einem Urheberrechtsprozess möglicherweise wichtige Beweise versehentlich gelöscht zu haben.

🕒 Die Anwälte der Kläger gaben an, dass sie viel Zeit und Personalaufwand für die Datenwiederherstellung aufgewendet haben.

💼 OpenAI besteht darauf, dass die Verwendung öffentlich zugänglicher Daten zum Trainieren seiner Modelle eine zulässige Nutzung darstellt.