Recientemente, en la 12ª Conferencia sobre Finanzas Digitales y Fintech, parte de la serie de foros de Zhongguancun, la solución de detección de Deepfake de Ant Group fue seleccionada como "Caso de innovación y aplicación de tecnología financiera".
Ant Group, apoyándose en su laboratorio Tianji, construyó por primera vez en la industria un conjunto de datos Deepfake a gran escala, de alta calidad y multimodal. Este conjunto, que incluye más de un millón de contenidos multimedia, simula a fondo los ataques Deepfake en entornos de control de riesgos financieros del mundo real, convirtiéndose en un estándar importante para evaluar el rendimiento de los modelos de detección Deepfake existentes en el sector financiero. En escenarios de negocios financieros, la precisión de detección de Deepfake de Ant Group en múltiples conjuntos de datos de prueba superó el 98%, y logró detener con éxito varios intentos de fraude utilizando tecnología Deepfake, protegiendo así los activos de los usuarios.
Este conjunto de datos resolvió el problema de la imposibilidad de entrenar modelos de detección Deepfake a gran escala y de evaluarlos en entornos reales en el ámbito financiero, y promovió el desarrollo de modelos de detección tradicionales desde una perspectiva de análisis multimodal. Actualmente, este conjunto de datos se ha convertido en una capacidad clave del producto anti-falsificación ZOLOZ Deeper de Ant Group para servir a sus clientes externos.
Según se informa, Ant Group utilizó hasta 81 tecnologías Deepfake avanzadas para generar imágenes sintéticas de alta calidad, abarcando diversos tipos de técnicas de falsificación, condiciones de iluminación complejas, entornos de fondo y expresiones faciales, para simular un entorno de ataque realista y complejo. Además de imágenes estáticas, también recopiló y generó una gran cantidad de datos de video con audio, incluyendo más de 100 tipos de técnicas de falsificación, que abarcan diferentes idiomas, acentos y ruidos de fondo, asegurando la diversidad y complejidad del conjunto de datos.
En la etapa de preprocesamiento y etiquetado de datos, Ant Group limpió y preprocesó los datos recopilados para asegurar su calidad. Un equipo de expertos etiquetó los datos, especificando si cada imagen o video era contenido generado por Deepfake, al tiempo que se garantizaba la minimización de las huellas de falsificación para lograr un efecto de alta fidelidad. Anteriormente, Ant Group lanzó una plataforma de síntesis y producción de datos de IA, logrando un "liderazgo de la IA" en el etiquetado de datos, reduciendo la dependencia de la anotación manual en más del 70%.
Además, Ant Group lanzó un desafío de ataque y defensa Deepfake en la Conferencia de Waibaidu 2024, utilizando el conjunto de datos Deepfake como datos de entrenamiento y prueba básicos para la competición, atrayendo a más de 2200 participantes de 26 países y regiones de todo el mundo. A través de las soluciones algorítmicas aportadas por los participantes del concurso, se verificó y evaluó eficazmente la calidad del ataque y la dificultad de detección del conjunto de datos Deepfake.
Con el desarrollo de la inteligencia artificial, la tecnología Deepfake también está avanzando rápidamente. Esta tecnología, que utiliza algoritmos de aprendizaje profundo, puede reemplazar rostros en videos de forma realista. Aunque Deepfake tiene aplicaciones positivas en el entretenimiento y los medios de comunicación, en el ámbito financiero, especialmente en la verificación de identidad y transacciones, la tecnología Deepfake presenta nuevos riesgos. Los sistemas de verificación de identidad de las instituciones financieras suelen depender de la biometría, como el reconocimiento facial. Si estos sistemas son engañados por la tecnología Deepfake, pueden producirse fraudes financieros graves.
Por lo tanto, el desarrollo de sistemas de detección de ataques Deepfake es esencial en el sector financiero. Sin embargo, los robustos modelos de defensa contra la detección de Deepfake requieren conjuntos de datos Deepfake de rostros de alta calidad que reflejen entornos del mundo real. Por lo tanto, la creación de conjuntos de datos que simulen el mundo real y la verificación de su eficacia son problemas urgentes.