OpenAI offenbart Trainingsdaten in Urheberrechtsstreit

Kürzlich einigte sich OpenAI in einem viel beachteten Urheberrechtsprozess darauf, den Anwälten der Kläger die zum Trainieren seines generativen KI-Modells verwendeten Daten offenzulegen.

Notfallzentrum, Datenanalytiker

Bildquelle: Das Bild wurde mit KI generiert und von Midjourney lizenziert.

Zu den Klägern gehören bekannte Autoren wie Paul Tremblay, Sarah Silverman, Michael Chabon, David Henry Hwang und Ta-Nehisi Coates. Sie verklagten OpenAI und seine verbundenen Unternehmen im vergangenen Jahr, weil sie behaupteten, die KI habe ihre Werke ohne Genehmigung verwendet und auf dieser Grundlage Texte generiert, was gegen das US-Urheberrecht und staatliche Gesetze gegen unlauteren Wettbewerb verstoße.

Nach dem Urteil von US-Bezirksrichter Robert N. Scola erhalten die Kläger Zugang zu einer sicheren Einrichtung von OpenAI, in der sie die Trainingsdaten einsehen können. Dieser Prozess ist streng reglementiert. Jegliche Aufzeichnungsgeräte sind im Sicherheitsraum verboten, und das Rechtsteam von OpenAI hat das Recht, alle Notizen einzusehen, die die Anwälte im Raum machen. Diese Maßnahmen machen die Offenlegung der Trainingsdaten eher einer Prüfung sensiblen Quellcodes ähnlich als einem einfachen Informationsaustausch.

Obwohl OpenAI rechtlich darauf besteht, dass seine Nutzung urheberrechtlich geschützter Werke der „Fair Use“-Doktrin entspricht, hat dieser Fall mehr Aufmerksamkeit erregt, da eine breite Offenlegung der Trainingsdaten von OpenAI weitere Rechtsstreitigkeiten auslösen könnte. Gegenwärtig stammen die Urheberrechtsvorwürfe gegen OpenAI nicht nur von diesen Autoren, sondern auch von anderen Klägern, die ähnliche Klagen einreichen.

Es ist erwähnenswert, dass in Zukunft möglicherweise mehr Vorschriften KI-Entwickler verpflichten werden, ihre Trainingsdaten transparenter offenzulegen. Der EU-AI-Act, der voraussichtlich 2025 in Kraft treten wird, verlangt von Modellanbietern die Offenlegung detaillierter Informationen über die Trainingsdaten, um den berechtigten Interessen betroffener Gruppen gerecht zu werden. Darüber hinaus hat Kalifornien ein Gesetz zur Transparenz von KI-Daten verabschiedet, das vom Gouverneur unterzeichnet wurde.

Obwohl OpenAI darauf besteht, dass seine generierten Inhalte auf dem Verständnis von Sprache, Schlussfolgerungen und der Welt beruhen, ist die rechtliche Frage, ob das Verhalten von KI-Modellen angemessen ist, weiterhin umstritten. Mit der zunehmenden Zahl von Rechtsstreitigkeiten und Gesetzesvorschlägen ist die Zukunft des KI-Bereichs weiterhin ungewiss.

Wichtigste Punkte:
📝 OpenAI stimmt der Offenlegung der Trainingsdaten gegenüber Anwälten zu, um die Anforderungen des Urheberrechtsprozesses zu erfüllen.
🔒 Die Datenprüfung findet unter streng kontrollierten Sicherheitsbedingungen statt, wobei Aufzeichnungsgeräte verboten sind.
⚖️ In Zukunft könnten weitere Vorschriften die Anforderungen an die Transparenz von KI-Daten erhöhen.

KI-Nachrichten und -Informationen

OpenAI offenbart Trainingsdaten in Urheberrechtsstreit – nur für Anwälte einsehbar

AIbase基地