Laut einem Bericht des Magazins „Wired“ verwenden mehrere Tech-Giganten, darunter Apple, Nvidia, Anthropic und Salesforce, ohne Erlaubnis Tausende von YouTube-Videos zum Trainieren ihrer KI-Modelle. Dies hat eine ernste Urheberrechts- und ethische Kontroverse ausgelöst.

Der Bericht enthüllt, dass diese Unternehmen Untertitel verschiedener YouTube-Videos in ihre KI-Trainingsdatensätze integriert haben. Betroffen sind zahlreiche Urheber, darunter bekannte YouTuber wie MKBHD, MrBeast und Jacksepticeye, Comedians wie Stephen Colbert, John Oliver und Jimmy Kimmel, Bildungskanäle wie MIT, Khan Academy und Harvard sowie Mainstream-Medien wie das Wall Street Journal und NPR.

Roboter, Künstliche Intelligenz, Gesichtserkennung, KI

Bildquelle: Das Bild wurde mit KI generiert und stammt von Midjourney.

Diese Daten wurden tatsächlich von einer Non-Profit-Organisation namens Eleuther AI heruntergeladen und zusammengestellt. Die Organisation stellte diese Inhalte als Teil ihres veröffentlichten großen Datensatzes „The Pile“ zur Verfügung, ursprünglich mit der Absicht, kleineren Entwicklern und Wissenschaftlern Trainingsmaterial zu bieten. Diese Datensätze wurden jedoch anschließend von großen Technologieunternehmen genutzt.

Es ist erwähnenswert, dass Unternehmen wie Apple diese Daten nicht direkt von YouTube heruntergeladen haben, sondern den von Eleuther AI zusammengestellten Datensatz verwendet haben. Technisch gesehen verstößt Eleuther AI gegen die YouTube-Nutzungsbedingungen, nicht die Technologieunternehmen.

Dieser Vorfall hat eine Diskussion über die Legalität und Ethik der Datenquellen für KI-Training ausgelöst. Er unterstreicht die Bedeutung von Datenurheberrechten und Nutzungslizenzen im schnell wachsenden KI-Bereich und die Unzulänglichkeiten der bestehenden Gesetze und Vorschriften angesichts dieser neuen technologischen Herausforderungen. Gleichzeitig wirft er neue Fragen nach dem Gleichgewicht der Interessen zwischen Urhebern, Plattformen und KI-Unternehmen auf.