O CEO do Meta, Mark Zuckerberg, usou a luta do YouTube contra conteúdo pirata em litígios recentes para defender o uso de dados protegidos por direitos autorais pela empresa no treinamento de IA. O caso, Kadrey vs. Meta, é um dos muitos processos por direitos autorais contra empresas de IA nos tribunais americanos, com autores conhecidos como Sarah Silverman e Ta-Nehisi Coates entre os autores.

Direitos autorais (1)(1)

De acordo com trechos de depoimentos de Zuckerberg divulgados recentemente, ele apontou que, embora possa haver alguma pirataria no YouTube, o YouTube ainda trabalha para removê-la. “A maioria do conteúdo no YouTube deve ser legal; eles têm as licenças apropriadas”, disse Zuckerberg. Essa declaração sugere sua posição sobre o uso pelo Meta do conjunto de dados de livros eletrônicos protegidos por direitos autorais chamado LibGen para treinamento de IA.

O LibGen é um site agregador de links que fornece obras protegidas por direitos autorais de várias editoras, incluindo Cengage Learning, McGraw-Hill e Pearson Education. O site foi processado várias vezes por violação de direitos autorais e multado em dezenas de milhões de dólares. Documentos judiciais mostram que, embora a equipe de IA do Meta tenha expressado preocupações sobre os riscos legais do uso do LibGen, Zuckerberg ainda assim aprovou seu uso como conjunto de dados de treinamento.

Em seu depoimento, Zuckerberg afirmou não estar familiarizado com o LibGen, mas disse que seria irracional proibir o uso de plataformas como o YouTube. “Não, eu não gostaria de criar políticas para as pessoas usarem o YouTube, porque algum conteúdo pode ser protegido por direitos autorais”, disse ele. Ele também admitiu que o Meta precisa ser cuidadoso ao usar material protegido por direitos autorais para treinamento.

De acordo com as acusações mais recentes dos advogados dos autores, o Meta cruzou referências entre alguns livros piratas do LibGen e livros protegidos por direitos autorais licenciados para determinar se deveria ou não celebrar acordos de licença com editores. Além disso, os autores também acusam o Meta de usar o conjunto de dados do LibGen para treinar seu modelo Llama mais recente e de ter baixado livros eletrônicos de outra fonte pirata, a Z-Library, para treinamento.

A Z-Library também foi alvo de várias ações legais por questões de direitos autorais, e seus mantenedores foram acusados em 2022 de violação de direitos autorais, fraude eletrônica e lavagem de dinheiro.

Destaques:

📚 Zuckerberg usou o caso do YouTube em tribunal para defender o uso de material protegido por direitos autorais pelo Meta no treinamento de IA.

🔍 Os autores acusam o Meta de usar o conjunto de dados de livros piratas LibGen para treinar o modelo Llama e de esconder informações relevantes.

⚖️ O Meta enfrenta vários processos por direitos autorais, e os riscos legais relacionados geraram discussões e preocupações internas.