Kürzlich wurde eine geheime Aktion des Technologieriesen Nvidia zur Datenerfassung aufgedeckt. Berichten des Mediums 404 zufolge, sammelte Nvidia massenhaft Daten von YouTube-Videos, um seine KI-Modelle zu trainieren. Dieses Vorgehen ist sowohl rechtlich als auch ethisch höchst fragwürdig.
Dem Bericht zufolge nutzt Nvidia diese Videodaten zum Training verschiedener KI-Modelle, darunter das Deep-Learning-Modell Cosmos, Algorithmen für autonomes Fahren, digitale KI-Avatare und das 3D-Weltbauwerkzeug Omniverse.
Nvidia setzte offenbar zahlreiche verdeckte Maßnahmen ein, um seine Datenerfassung zu verschleiern. Es wurden mehrere „virtuelle Maschinen“ verwendet und die IP-Adressen ständig gewechselt, um von YouTube nicht entdeckt zu werden. Weder die Videoersteller noch Googles Muttergesellschaft YouTube erteilten eine Genehmigung für diese Datenerfassung.
Interne Kommunikation bei Nvidia zeigt eine recht kühne Strategie. Ein Manager erwähnte in einer E-Mail den Aufbau einer „Videodatenfabrik“, die täglich Daten im Umfang der visuellen Erfahrungen eines ganzen Menschenlebens generiert.
Interessanterweise zeigte sich das Management, als Mitarbeiter Bedenken hinsichtlich der Legalität und Ethik dieser Datenerfassung äußerten, sehr zuversichtlich und argumentierte, dies sei eine Entscheidung der obersten Führungsebene. Die E-Mail lautete: „Wir haben für alle Daten eine umfassende Genehmigung.“
Besonders beunruhigend ist, dass Nvidia über einen gewissen Zeitraum wissentlich einen Datensatz namens HD-VG-130M mit 130 Millionen YouTube-Videos verwendete, der ursprünglich für die akademische Forschung bestimmt war. Viele Experten äußerten scharfe Kritik und sehen die kommerzielle Nutzung von Forschungsdaten als Missbrauch an.
Als zentraler Akteur der KI-Industrie nimmt Nvidia eine herausragende Marktposition ein. Seine Grafikprozessoren (GPUs) bilden die Grundlage vieler rechenintensiver KI-Systeme. Unternehmen wie OpenAI, Microsoft und Google, die mit Nvidia zusammenarbeiten, zeigten sich besorgt. Ein Google-Sprecher erklärte, die unerlaubte Nutzung von YouTube-Daten verstoße eindeutig gegen die Nutzungsbedingungen der Plattform.
Nvidia erklärte in seiner Antwort auf die Medien, sein KI-Training sei „vollständig im Einklang mit dem Geist und dem Wortlaut des Urheberrechts“. Wie die Urheber der verwendeten Inhalte diese Aussage jedoch bewerten, bleibt abzuwarten.
Wichtigste Punkte:
📹 Nvidia sammelt heimlich massenhaft YouTube-Videodaten zum KI-Training; rechtliche und ethische Fragen geben Anlass zur Sorge.
💻 Interne E-Mails zeigen, dass Nvidia-Manager diese Aktion als umfassend genehmigt betrachten und eine recht kühne Haltung einnehmen.
📜 Google weist darauf hin, dass die unerlaubte Nutzung von YouTube-Daten eindeutig gegen die Nutzungsbedingungen der Plattform verstößt; Nvidias Antwort sorgt für Kontroversen.