Versão Beta 1 do MacOS 15.1: Inteligência Artificial da Apple Vulnerável a Ataques de 'Injeção de Prompt'

AIbase基地

Publicado emNotícias e Informações de IA · 4 minutos de leitura · Aug 12, 2024

433

Recentemente, um desenvolvedor conseguiu controlar com sucesso o novo sistema de IA da Apple, o Apple Intelligence, no MacOS 15.1 Beta 1. Ele utilizou um método de ataque conhecido como "injeção de prompt", enganando facilmente a IA para que ignorasse suas instruções originais e respondesse a prompts arbitrários. Este evento gerou grande atenção na indústria.

O desenvolvedor Evan Zhou demonstrou o processo de exploração dessa vulnerabilidade no YouTube. Seu objetivo inicial era manipular a função de "reescrita" do Apple Intelligence, normalmente usada para melhorar a qualidade do texto. No entanto, o comando inicial de Zhou, "ignorar instruções anteriores", não funcionou. Surpreendentemente, através de informações compartilhadas por um usuário do Reddit, ele descobriu o modelo de prompt do sistema Apple Intelligence e marcadores especiais que separam o papel do sistema do papel do usuário.

Usando essas informações, Zhou conseguiu criar um prompt que sobrepôs o prompt original do sistema. Ele encerrou antecipadamente o papel do usuário, inserindo um novo prompt do sistema que instruía a IA a ignorar comandos anteriores e responder ao texto subsequente. Após algumas tentativas, o ataque foi bem-sucedido! O Apple Intelligence não apenas respondeu às instruções de Zhou, mas também forneceu informações que ele não havia solicitado, provando a eficácia da injeção de prompt.

Evan Zhou também publicou seu código no GitHub. Vale mencionar que, embora esse ataque de "injeção de prompt" não seja novidade em sistemas de IA – sendo conhecido desde o lançamento do GPT-3 em 2020 –, ele ainda não foi completamente resolvido. A Apple merece algum crédito, pois o Apple Intelligence é mais complexo em sua proteção contra injeção de prompt em comparação com outros sistemas de bate-papo. Muitos sistemas de bate-papo, por exemplo, podem ser facilmente enganados com a simples entrada direta na janela de bate-papo ou por meio de texto oculto em imagens. Mesmo sistemas como ChatGPT ou Claude ainda podem ser vítimas de ataques de injeção de prompt em algumas circunstâncias.

Destaques:
🌟 O desenvolvedor Evan Zhou utilizou "injeção de prompt" para controlar com sucesso o sistema de IA da Apple, fazendo-o ignorar comandos originais.
🔍 Zhou utilizou informações de prompt compartilhadas por um usuário do Reddit para criar um método de ataque que sobrepõe o prompt do sistema.
🛡️ Apesar de ser relativamente mais complexo, o problema de "injeção de prompt" ainda não foi totalmente resolvido no sistema de IA da Apple, permanecendo um ponto crítico de atenção na indústria.

Por que a OpenAI ainda não lançou agentes de IA? Preocupações com ataques de 'injeção de prompt'

Com o rápido desenvolvimento da tecnologia de inteligência artificial, muitas empresas estão lançando seus próprios sistemas de 'agentes de IA', que podem interagir autonomamente com o ambiente e concluir tarefas sem intervenção humana. A Microsoft e a Anthropic já lançaram seus próprios agentes de IA, enquanto a líder do setor, OpenAI, ainda não lançou sua versão, o que levanta questões. De acordo com a publicação The Information, o atraso da OpenAI está relacionado a ataques de 'injeção de prompt'.

Vulnerabilidade de vazamento de dados relatada no Slack AI: injeção de prompt malicioso pode roubar informações de canais privados

A empresa de segurança PromptArmor revelou uma grave vulnerabilidade de segurança no Slack AI, indicando sua suscetibilidade a ataques de injeção de prompt malicioso. O Slack AI, um recurso adicional do serviço de comunicação em equipe da Salesforce, é usado para tarefas generativas, como resumir conversas, responder a perguntas e agregar informações de canais pouco acessados. No entanto, a PromptArmor aponta que a segurança do Slack AI não atende às expectativas. A vulnerabilidade principal reside na capacidade do Slack de consultar dados de canais públicos e privados, incluindo informações de usuários não...

Embaraçoso! O sistema de segurança de IA do Meta é facilmente contornado por ataque de 'espaços'

O modelo Prompt-Guard-86M lançado pelo Meta visa defender contra ataques de injeção de prompt, protegendo a segurança do sistema ao restringir modelos de linguagem grandes de processarem entradas inadequadas. No entanto, o próprio modelo expôs riscos de ataque. Aman Priyanshu descobriu que, ao adicionar espaçamentos simples ou remover pontuação na entrada, o modelo ignora as instruções de segurança anteriores, obtendo uma taxa de sucesso de ataque próxima a 100%. Essa descoberta destaca a importância da segurança de IA, embora o Prompt

Notícias e Informações de IA

Versão Beta 1 do MacOS 15.1: Inteligência Artificial da Apple Vulnerável a Ataques de 'Injeção de Prompt'

AIbase基地

Notícias de IA Relacionadas Recomendadas

Por que a OpenAI ainda não lançou agentes de IA? Preocupações com ataques de 'injeção de prompt'

Vulnerabilidade de vazamento de dados relatada no Slack AI: injeção de prompt malicioso pode roubar informações de canais privados

Embaraçoso! O sistema de segurança de IA do Meta é facilmente contornado por ataque de 'espaços'