Recentemente, na 12ª Conferência Anual de Finanças Digitais e Finanças Tecnológicas, parte da série de eventos do Fórum Zhongguancun, a solução de detecção de Deepfake da Ant Group foi selecionada como um “Caso de Inovação e Aplicação de Tecnologia Financeira”.

Com base em seu laboratório Tianji, a Ant Group construiu, pela primeira vez na indústria, um conjunto de dados Deepfake em larga escala, de alta qualidade e multimodal. Este conjunto de dados, contendo mais de um milhão de conteúdos multimídia sintetizados, simula completamente os ataques de Deepfake em cenários de controle de risco financeiro do mundo real, tornando-se um padrão importante para avaliar o desempenho dos modelos de detecção de Deepfake existentes no setor financeiro. Em cenários de negócios financeiros, a taxa de precisão da detecção de Deepfake da Ant Group em vários conjuntos de dados de teste atingiu mais de 98%, bloqueando com sucesso várias tentativas de fraude usando tecnologia Deepfake e protegendo os ativos dos usuários.

Este conjunto de dados resolveu o problema de modelos de detecção de Deepfake em finanças não poderem ser treinados em larga escala e não poderem ser avaliados em ambientes reais. Além disso, promoveu o desenvolvimento de modelos de detecção tradicionais a partir da perspectiva de análise multimodal. Atualmente, este conjunto de dados se tornou uma capacidade fundamental para o serviço ao cliente do produto anti-Deepfake ZOLOZ Deeper da Ant Group.

image.png

Entende-se que a Ant Group utilizou até 81 tipos de tecnologia Deepfake avançada para gerar imagens sintéticas de alta qualidade, abrangendo vários tipos de técnicas de falsificação, condições de iluminação complexas, ambientes de fundo e expressões faciais, a fim de simular um ambiente de ataque realista e complexo. Além de imagens estáticas, também foram coletados e gerados muitos dados de vídeo com áudio, incluindo mais de 100 tipos de técnicas de falsificação, abrangendo diferentes idiomas, sotaques e ruídos de fundo, garantindo a diversidade e complexidade do conjunto de dados.

Na fase de pré-processamento e rotulagem de dados, a Ant Group limpou e pré-processou os dados coletados para garantir a qualidade dos dados. Uma equipe de especialistas rotulou os dados, especificando se cada imagem ou vídeo foi gerado por Deepfake, ao mesmo tempo em que garantiu a minimização de vestígios de falsificação, alcançando um efeito altamente realista. Anteriormente, a Ant Group lançou uma plataforma de síntese e produção de dados de IA, alcançando a "liderança da IA" no nível de rotulagem de dados, reduzindo a dependência de rotulagem manual em mais de 70%.

Além disso, a Ant Group lançou um desafio de defesa contra Deepfake na Conferência Wai Tan 2024, usando o conjunto de dados Deepfake como dados de treinamento e teste básicos para a competição, atraindo mais de 2200 participantes de 26 países e regiões em todo o mundo. Através das soluções de algoritmos contribuídas pelos participantes do desafio, a qualidade do ataque do conjunto de dados Deepfake e a dificuldade de detecção foram eficazmente validadas e avaliadas.

Com o desenvolvimento da inteligência artificial, a tecnologia Deepfake também está progredindo rapidamente. Esta tecnologia, que utiliza algoritmos de aprendizado profundo, pode substituir rostos em vídeos de forma realista. Embora o Deepfake tenha aplicações positivas em entretenimento e mídia, no setor financeiro, especialmente em verificação de identidade e transações, a tecnologia Deepfake apresenta novos riscos. Os sistemas de verificação de identidade das instituições financeiras geralmente dependem de tecnologias biométricas, como reconhecimento facial. Se esses sistemas forem enganados pela tecnologia Deepfake, pode resultar em sérias fraudes financeiras.

Diante disso, o desenvolvimento de sistemas de detecção de ataques Deepfake no setor financeiro é essencial, mas modelos de defesa de detecção de Deepfake poderosos exigem conjuntos de dados Deepfake de alta qualidade que correspondam a ambientes do mundo real. Portanto, como construir conjuntos de dados que simulem o mundo real e como validar sua eficácia são questões urgentes.