Estudo sobre os Riscos de Vazamento de Dados de Treinamento do ChatGPT

AIGC开放社区

Publicado emNotícias e Informações de IA · 1 minutos de leitura · Dec 12, 2023

Modelos de linguagem grandes, como o ChatGPT, memorizam uma quantidade de dados de treinamento originais durante o processo de treinamento. Atacadores podem extrair grandes quantidades desses dados de treinamento do modelo usando métodos de ataque específicos, ameaçando a privacidade dos proprietários dos dados. Os pesquisadores recomendam que medidas de proteção de dados sejam implementadas e usadas ao desenvolver e usar modelos de linguagem grandes para evitar vazamentos de dados.

OpenAI contesta decisão da justiça indiana, recusando-se a remover dados de treinamento do ChatGPT

Recentemente, a empresa americana de inteligência artificial OpenAI contestou a decisão do Tribunal Superior de Delhi, na Índia, argumentando que o tribunal não tem o direito de exigir a remoção dos dados de treinamento do ChatGPT. O caso decorre de um processo movido pela agência de notícias indiana ANI em novembro passado, alegando que a OpenAI usou seu conteúdo publicado sem autorização para treinar o ChatGPT. A ANI solicitou a remoção de seu conteúdo do conjunto de dados de treinamento do modelo e acusou a OpenAI de violação de direitos autorais. Em documento apresentado ao Tribunal Superior de Delhi em 10 de janeiro...

Executivos do Meta obcecados em superar o GPT-4, dados de treinamento enfrentam polêmica de direitos autorais!

Recentemente, com o andamento de um caso de direitos autorais de inteligência artificial – o caso Kadrey vs. Meta – informações internas da empresa Meta foram liberadas pelo tribunal, revelando a obsessão dos executivos da empresa em superar o modelo GPT-4 da OpenAI durante o desenvolvimento do Llama3. Em uma mensagem de outubro de 2023, o vice-presidente de IA generativa da Meta, Ahmad Al-Dahle, mencionou: “Honestamente, nosso objetivo tem que ser o GPT”

Lançado o primeiro modelo global de transparência de dados de treinamento de IA para promover a transparência na indústria de IA

Em um esforço para promover a transparência no campo da inteligência artificial (IA), a Computer & Communications Industry Association (CCIA) anunciou conjuntamente em Bruxelas e Washington uma nova iniciativa inovadora: um modelo global de relatório de transparência da indústria. Este modelo visa aumentar a confiança e a compreensão pública dos dados de treinamento de modelos de inteligência artificial generativa (GPAI). O 'Modelo de Transparência de Dados de Treinamento de IA' lançado exige que as empresas divulguem os tipos de dados usados para treinar modelos GPAI específicos, como podcasts, livros, etc., e também indiquem a principal origem dos dados.

Microsoft lança modelo generativo de IA Phi-4 com aprimoramentos em matemática e qualidade dos dados de treinamento

A Microsoft anunciou o mais novo membro da sua família de modelos generativos de IA Phi: o Phi-4. Em comparação com as versões anteriores, o Phi-4 apresenta melhorias em diversos aspectos, com destaque para a resolução de problemas matemáticos, graças a uma melhoria na qualidade dos dados de treinamento. Até quinta-feira à noite, o acesso ao Phi-4 era relativamente limitado, disponível apenas na plataforma de desenvolvimento Azure AI Foundry da Microsoft, e somente para fins de pesquisa sob contrato de pesquisa da Microsoft. Nota da imagem: Imagem gerada por IA, uso de imagem autorizado.