El CEO de Meta, Mark Zuckerberg, utilizó recientemente la lucha de YouTube contra el contenido pirata en una demanda judicial para defender el uso de datos con derechos de autor por parte de la empresa en el entrenamiento de IA. El caso, Kadrey contra Meta, es uno de los muchos litigios por derechos de autor contra empresas de IA en los tribunales estadounidenses, con la escritora Sarah Silverman y Ta-Nehisi Coates entre los demandantes.
Según extractos de la declaración de Zuckerberg recientemente publicados, señaló que, aunque YouTube puede albergar cierto contenido pirata, la plataforma trabaja para eliminarlo. "La mayoría del contenido en YouTube debería ser legal, con las licencias correspondientes", afirmó Zuckerberg. Esta declaración alude a su postura sobre el uso por parte de Meta del conjunto de datos de libros electrónicos con derechos de autor llamado LibGen para el entrenamiento de IA.
LibGen es un sitio web de agregación de enlaces que ofrece obras con derechos de autor de varias editoriales, incluyendo Cengage Learning, McGraw-Hill y Pearson Education. El sitio ha sido demandado varias veces por infracción de derechos de autor y ha recibido multas de decenas de millones de dólares. Documentos judiciales muestran que, aunque el equipo de IA de Meta expresó preocupaciones sobre los riesgos legales del uso de LibGen, Zuckerberg aún así aprobó su uso como conjunto de datos de entrenamiento.
Durante el interrogatorio, Zuckerberg afirmó no estar familiarizado con LibGen, pero dijo que sería irrazonable prohibir el uso de plataformas como YouTube. "No, no querría establecer políticas para que la gente use YouTube, porque parte del contenido puede estar protegido por derechos de autor", dijo. Al mismo tiempo, reconoció que Meta debe actuar con cautela al utilizar material con derechos de autor para el entrenamiento.
Según las acusaciones más recientes de los abogados de los demandantes, Meta cruzó referencias entre algunos libros piratas de LibGen y libros con derechos de autor disponibles bajo licencia para decidir si debía llegar a acuerdos de licencia con los editores. Además, los demandantes acusan a Meta de haber utilizado el conjunto de datos de LibGen para entrenar su último modelo Llama, y de haber descargado libros electrónicos de otro origen pirata, Z-Library, para el entrenamiento.
Z-Library también ha sido objeto de múltiples acciones legales por cuestiones de derechos de autor, y sus mantenedores fueron acusados en 2022 de infracción de derechos de autor, fraude informático y lavado de dinero.
Puntos clave:
📚 Zuckerberg utiliza el caso de YouTube en la corte para defender el uso de material con derechos de autor por parte de Meta en el entrenamiento de IA.
🔍 Los demandantes acusan a Meta de utilizar el conjunto de datos de libros piratas LibGen para entrenar el modelo Llama y de ocultar información relacionada.
⚖️ Meta enfrenta múltiples demandas por derechos de autor, y los riesgos legales asociados han generado debate e interés interno.