Kürzlich stand die Vorgehensweise von Meta im Bereich des KI-Trainings stark in der Kritik. Laut einer Klage wird dem Unternehmen vorgeworfen, ohne Genehmigung massenhaft urheberrechtlich geschützte E-Books und Artikel heruntergeladen und zum Trainieren seiner KI-Modelle verwendet zu haben. Im Mittelpunkt des Geschehens stehen mehrere geleakte E-Mails, die Metas Vorgehen weiter belegen.
Die E-Mails zeigen, dass Meta den umstrittenen, riesigen Datensatz LibGen zugibt, der zig Millionen Raubkopien von Büchern enthält. Laut Gerichtsdokumenten der Kläger hat Meta über die Website „Anna's Archive“ mindestens 81,7 TB Daten von verschiedenen Schattenbibliotheken heruntergeladen, darunter mindestens 35,7 TB von Z-Library und LibGen. Zusätzlich hatte Meta zuvor bereits 80,6 TB von LibGen heruntergeladen. Diese Zahlen verdeutlichen das erschreckende Ausmaß von Metas illegalen Aktivitäten. Die Kläger weisen darauf hin, dass Metas Vorgehen, im Gegensatz zu anderen kleineren Fällen von Urheberrechtsverletzungen, die bereits rechtliche Konsequenzen nach sich gezogen haben, besonders schwerwiegend ist.
In den E-Mails äußerten Metas Mitarbeiter auch Bedenken hinsichtlich der rechtlichen Risiken ihres Handelns. Im April 2023 bemerkte der Forschungsingenieur Nikola Baschlikow: „Es fühlt sich nicht richtig an, mit dem Firmenlaptop BitTorrent zu nutzen.“ Im September 2023 wurde seine Kritik deutlicher, und er konsultierte das Rechtsteam. Er betonte: „Die Nutzung von Torrents bedeutet, Dateien zu ‚seeden‘, also Inhalte öffentlich zu teilen. Das ist rechtlich nicht zulässig.“ Trotz dieser Warnungen scheint Meta seine Download- und Sharing-Aktivitäten verschleiert und durch die Anpassung der Einstellungen die Rückverfolgbarkeit des „Seedens“ so gut wie möglich reduziert zu haben.
Meta soll außerdem versucht haben, das Risiko, auf seine Server zurückverfolgt zu werden, zu minimieren, indem es die Datensätze auf Nicht-Meta-Servern herunterlud. Dieses Vorgehen hat zu einer intensiven öffentlichen Diskussion über Metas Umgang mit Daten und Urheberrechten geführt.
Wichtigste Punkte:
📚 Meta wird vorgeworfen, illegal 81,7 TB urheberrechtlich geschützter Bücher heruntergeladen zu haben, angeblich zur KI-Schulung.
⚖️ Mitarbeiter äußerten Bedenken hinsichtlich der rechtlichen Risiken und warnten vor möglichen Rechtsverstößen durch das Herunterladen.
🔍 Meta versuchte, durch Verschleierung und die Nutzung von externen Servern die rechtliche Verantwortung zu umgehen.