La fonction de recherche de ChatGPT expose à des risques potentiels : manipulation malveillante et diffusion de contenu non fiable

AIbase基地

Publié leActualités IA · 4 minutes de lecture · Dec 26, 2024

158

Récemment, une enquête du journal britannique The Guardian a révélé de potentielles failles de sécurité dans l’outil de recherche ChatGPT d’OpenAI. L’enquête a démontré que ChatGPT pouvait être manipulé lors du traitement de résumés de pages web contenant du contenu caché, allant même jusqu’à renvoyer du code malveillant. Ce contenu caché peut inclure des instructions tierces visant à perturber les réponses de ChatGPT, ou un grand volume de texte caché faisant la promotion d’un produit ou service.

Hacker de caractères aléatoires

Source : Image générée par IA, fournie par Midjourney.

Lors des tests, un lien vers une fausse page produit d’un appareil photo a été fourni à ChatGPT, avec pour consigne de déterminer si cet appareil valait l’achat. Sur une page normale, ChatGPT a pu indiquer de manière équilibrée les avantages et les inconvénients du produit. Cependant, lorsque le texte caché contenait des instructions demandant une évaluation positive, la réponse de ChatGPT est devenue entièrement positive, même en présence de critiques négatives sur la page. De plus, même sans instructions explicites, un simple texte caché pouvait influencer le résumé de ChatGPT, le poussant à donner une évaluation positive.

Jacob Larsen, expert en cybersécurité chez CyberCX, a averti que le lancement complet du système de recherche ChatGPT dans son état actuel présenterait un « risque élevé », car des individus pourraient concevoir des sites web spécifiques pour tromper les utilisateurs. Il a toutefois souligné qu’OpenAI disposait d’une solide équipe de sécurité IA et qu’il s’attendait à ce que les problèmes soient rigoureusement testés et corrigés avant la mise à disposition de la fonctionnalité pour tous les utilisateurs.

Des moteurs de recherche comme Google pénalisaient les sites web utilisant du texte caché, entraînant une baisse de leur classement, voire leur suppression complète. Karsten Nohl, scientifique en chef chez SR Labs, a indiqué que l’empoisonnement SEO constituait un défi pour tous les moteurs de recherche, et ChatGPT n’y échappait pas. Néanmoins, il ne s’agit pas d’un problème inhérent aux grands modèles linguistiques, mais plutôt d’un défi pour un nouvel acteur dans le domaine de la recherche.

Points clés :
🚨 ChatGPT peut être manipulé par du contenu caché, renvoyant des évaluations inexactes.
🔍 Le texte caché peut influencer l’évaluation de ChatGPT, même si la page contient des critiques négatives.
🛡️ OpenAI travaille activement à la résolution des problèmes potentiels afin d’améliorer la sécurité de son outil de recherche.

Les conseils erronés de l'IA engendrent des risques de sécurité : de l'identification des champignons aux guides de cuisine

Un incident récent survenu au sein d'un groupe Facebook d'amateurs de champignons a de nouveau soulevé des inquiétudes quant à la sécurité des applications d'IA. Selon 404Media, un agent IA nommé 'FungiFriend' a infiltré le groupe 'Identification et discussion sur les champignons du Nord-Est', qui compte 13 000 membres, et a donné des conseils erronés potentiellement mortels. Lorsqu'on lui a demandé comment cuisiner des champignons Sarcosphaera coronaria à forte teneur en arsenic, FungiFriend a non seulement donné une réponse erronée, mais…

Le modèle o1 d'OpenAI dévoilé : capacités exceptionnelles, traitement de 200 000 jetons

Récemment, un utilisateur a révélé sur le réseau social X qu'OpenAI avait brièvement rendu accessible son nouveau modèle o1 via l'URL "chatgpt.com/?model=o1" à certains utilisateurs, avant de rapidement le désactiver. Selon les retours utilisateurs, ce dernier modèle peut traiter environ 200 000 mots de texte et possède la capacité d'analyser des images. OpenAI qualifie le modèle o1 de "son modèle le plus puissant", particulièrement adapté aux tâches nécessitant créativité et raisonnement de haut niveau.

Lancement d'une plateforme de gestion des risques de sécurité dans la construction, basée sur l'IA, pour améliorer la sécurité des chantiers

Highwire lance un outil de gestion des risques de sécurité basé sur l'IA. Grâce à l'examen automatisé des documents et à l'identification des risques, il fournit aux entrepreneurs des informations approfondies, réduisant ainsi des milliers d'heures de travail traditionnellement consacrées à l'examen manuel. Cet outil permet une évaluation plus précise des entrepreneurs, aidant les gestionnaires à mettre en œuvre des stratégies d'atténuation avant le début des travaux. Il catégorise les protocoles de sécurité comme généraux, détaillés ou complets, dépassant ainsi les simples analyses de réussite/échec et permettant des décisions plus éclairées. Développée à l'Université Harvard, cette technologie d'IA est conçue pour servir les grandes entreprises disposant de plans de sécurité matures ainsi que les petits entrepreneurs, dans le but d'améliorer la sécurité.

Prévisions des tendances de la sécurité des applications GenAI pour 2023

Vulnérabilités de sécurité des applications GenAI dans les PME, manque de sensibilisation des entreprises aux risques liés aux applications GenAI, augmentation des investissements dans GenAI grâce à ChatGPT, incapacité des entreprises à suivre le rythme de l'évolution technologique de GenAI, augmentation des incidents de sécurité liés aux applications GenAI