O Google e a OpenAI enfrentam restrições de direitos autorais na coleta de dados para o treinamento de seus modelos de IA. Modelos de IA precisam de conteúdo gerado por humanos para melhorar sua qualidade, mas se as empresas deveriam pagar por esse conteúdo é uma questão em debate. A OpenAI começou a usar conjuntos de dados criados pelo ChatGPT para treinar o GPT-4, mas depender apenas desses dados pode levar à falha do modelo.