Récemment, une enquête du journal britannique The Guardian a révélé de potentielles failles de sécurité dans l’outil de recherche ChatGPT d’OpenAI. L’enquête a démontré que ChatGPT pouvait être manipulé lors du traitement de résumés de pages web contenant du contenu caché, allant même jusqu’à renvoyer du code malveillant. Ce contenu caché peut inclure des instructions tierces visant à perturber les réponses de ChatGPT, ou un grand volume de texte caché faisant la promotion d’un produit ou service.
Source : Image générée par IA, fournie par Midjourney.
Lors des tests, un lien vers une fausse page produit d’un appareil photo a été fourni à ChatGPT, avec pour consigne de déterminer si cet appareil valait l’achat. Sur une page normale, ChatGPT a pu indiquer de manière équilibrée les avantages et les inconvénients du produit. Cependant, lorsque le texte caché contenait des instructions demandant une évaluation positive, la réponse de ChatGPT est devenue entièrement positive, même en présence de critiques négatives sur la page. De plus, même sans instructions explicites, un simple texte caché pouvait influencer le résumé de ChatGPT, le poussant à donner une évaluation positive.
Jacob Larsen, expert en cybersécurité chez CyberCX, a averti que le lancement complet du système de recherche ChatGPT dans son état actuel présenterait un « risque élevé », car des individus pourraient concevoir des sites web spécifiques pour tromper les utilisateurs. Il a toutefois souligné qu’OpenAI disposait d’une solide équipe de sécurité IA et qu’il s’attendait à ce que les problèmes soient rigoureusement testés et corrigés avant la mise à disposition de la fonctionnalité pour tous les utilisateurs.
Des moteurs de recherche comme Google pénalisaient les sites web utilisant du texte caché, entraînant une baisse de leur classement, voire leur suppression complète. Karsten Nohl, scientifique en chef chez SR Labs, a indiqué que l’empoisonnement SEO constituait un défi pour tous les moteurs de recherche, et ChatGPT n’y échappait pas. Néanmoins, il ne s’agit pas d’un problème inhérent aux grands modèles linguistiques, mais plutôt d’un défi pour un nouvel acteur dans le domaine de la recherche.
Points clés :
🚨 ChatGPT peut être manipulé par du contenu caché, renvoyant des évaluations inexactes.
🔍 Le texte caché peut influencer l’évaluation de ChatGPT, même si la page contient des critiques négatives.
🛡️ OpenAI travaille activement à la résolution des problèmes potentiels afin d’améliorer la sécurité de son outil de recherche.