Recentemente, as práticas da Meta em relação ao treinamento de inteligência artificial têm sido alvo de grande atenção. De acordo com um processo judicial, a empresa é acusada de baixar ilegalmente uma grande quantidade de livros e artigos piratas para treinar seus modelos de IA, sem autorização. O cerne do caso reside em algumas mensagens de e-mail vazadas que fornecem mais evidências das ações da Meta.
As mensagens de e-mail mostram que a Meta admitiu ter baixado um conjunto de dados polêmico e volumoso chamado LibGen, contendo dezenas de milhões de livros piratas. De acordo com documentos judiciais apresentados pelos autores, a Meta baixou pelo menos 81,7 TB de dados de várias bibliotecas na shadow web através do site Anna's Archive, incluindo pelo menos 35,7 TB de dados do Z-Library e LibGen. Além disso, a Meta havia baixado anteriormente 80,6 TB de dados do LibGen. Esses números mostram a escala impressionante das atividades ilegais da empresa. Os autores argumentam que, embora outras atividades de pirataria em menor escala tenham resultado em processos judiciais, a conduta da Meta é ainda mais grave.
Nas mensagens de e-mail, os funcionários da Meta também expressaram preocupações sobre os riscos legais de suas ações. Em abril de 2023, o engenheiro de pesquisa Nikola Bashlikov disse: "Usar o laptop da empresa para baixar torrents não parece apropriado". Em setembro de 2023, a oposição de Bashlikov tornou-se mais forte, e ele consultou a equipe jurídica. Ele apontou que "usar torrents significa 'semear' arquivos, ou seja, compartilhar conteúdo publicamente. Isso é ilegal". No entanto, apesar desses avisos, a Meta parece ter decidido ocultar suas atividades de download e compartilhamento, e tentou minimizar a rastreabilidade do 'semear' através de configurações de edição.
Alega-se que a Meta também tentou reduzir o risco de ser rastreada até seus servidores baixando os conjuntos de dados para servidores que não pertencem à Meta. Essa série de ações levou a uma profunda reflexão sobre o uso de dados e os direitos autorais da Meta.
Destaques:
📚 A Meta é acusada de baixar ilegalmente 81,7 TB de livros piratas, supostamente para treinamento de IA.
⚖️ Funcionários expressaram preocupações sobre os riscos legais, alertando que as atividades de download poderiam ser ilegais.
🔍 A Meta tentou evitar a responsabilidade legal ocultando suas ações e usando servidores externos.