Recentemente, a OpenAI chegou a um acordo em um processo de direitos autorais muito aguardado, concordando em divulgar aos advogados dos autores os dados usados para treinar seus modelos de IA generativos.
Nota da imagem: Imagem gerada por IA, fornecida pela Midjourney.
Os autores, incluindo nomes conhecidos como Paul Tremblay, Sarah Silverman, Michael Chabon, David Henry Hwang e Ta-Nehisi Coates, processaram a OpenAI e suas afiliadas no ano passado, alegando que a IA usou suas obras sem autorização para gerar texto, violando as leis de direitos autorais federais e estaduais de concorrência desleal.
De acordo com a decisão do juiz federal Robert N. Scola Jr., os autores terão acesso a um ambiente seguro estabelecido pela OpenAI para visualizar os dados de treinamento. Este acesso é estritamente controlado. Dispositivos de gravação são proibidos na sala segura, e a equipe jurídica da OpenAI tem o direito de revisar quaisquer anotações feitas pelos advogados na sala. Essas medidas fazem com que a divulgação dos dados de treinamento se assemelhe mais a uma revisão de código-fonte sensível do que a um simples compartilhamento de informações.
Embora a OpenAI legalmente insista que seu uso de obras protegidas por direitos autorais constitui "uso justo", o caso gerou preocupações consideráveis, pois a ampla divulgação dos dados de treinamento da OpenAI pode levar a mais processos judiciais. Atualmente, as acusações de violação de direitos autorais contra a OpenAI não se limitam a esses autores, com outros autores também ingressando com ações semelhantes.
Vale ressaltar que, no futuro, pode haver mais regulamentações exigindo que os desenvolvedores de IA divulguem seus dados de treinamento de forma mais transparente. A Lei de Inteligência Artificial da UE, prevista para entrar em vigor em 2025, exige que os fornecedores de modelos divulguem detalhes sobre os dados de treinamento para atender às necessidades legítimas daqueles cujos direitos são afetados. Além disso, a Califórnia aprovou uma lei de transparência de dados de IA, sancionada pelo governador.
Apesar da OpenAI insistir que seu conteúdo gerado é baseado em sua compreensão da linguagem, raciocínio e mundo, a legalidade do comportamento dos modelos de IA permanece controversa. Com mais processos e propostas legislativas surgindo, o futuro do campo da IA permanece incerto.
Pontos importantes:
📝 A OpenAI concordou em divulgar os dados de treinamento aos advogados para atender às necessidades do processo de direitos autorais.
🔒 A visualização dos dados ocorrerá em um ambiente seguro e estritamente controlado, com dispositivos de gravação proibidos.
⚖️ No futuro, pode haver mais regulamentações que impulsionem a transparência dos dados de IA.