Recentemente, as organizações de notícias The Intercept, Raw Story e AlterNet entraram com uma ação contra a OpenAI e a Microsoft, alegando violação de direitos autorais. Alega-se que o ChatGPT, em alguns casos, copia quase que integralmente obras jornalísticas protegidas por direitos autorais. Prevê-se que os modelos de linguagem multimodal se tornem a tendência dominante no campo dos grandes modelos de linguagem no futuro, incluindo conteúdo textual, de imagem e vídeo. A intensa criação de políticas de IA gerou preocupações sobre os direitos autorais de conjuntos de dados e dados de treinamento de alta qualidade, e o valor de bancos de dados de treinamento de alta qualidade será destacado no futuro. Além disso, a China CITIC Press já colaborou com empresas de grandes modelos de linguagem para treinamento de linguagem, e a Visual China possui vantagens essenciais na era da geração de conteúdo de IA (AIGC), devido à transação de conteúdo digital, dados com direitos autorais claros e ampla experiência em gestão de direitos autorais.