Cet article présente le principe de l'ingénierie inverse des invites (Prompt), permettant de récupérer les invites intégrées à une IA. Les méthodes présentées incluent : 1) l'utilisation d'invites inverses pour inciter l'IA à ignorer ses paramètres prédéfinis et à renvoyer sa propre invite ; 2) l'utilisation de différentes invites inverses pour brouiller l'IA et obtenir l'invite originale ; 3) l'obtention d'informations clés sur l'invite grâce à une ingénierie inverse partielle. L'ingénierie inverse est confrontée à des difficultés telles que l'influence de la structure de l'invite et le renforcement de la sécurité de l'IA. À l'avenir, des postes de défense contre les attaques par invites pourraient émerger pour garantir la sécurité des applications d'IA. Globalement, l'ingénierie inverse des invites représente une nouvelle voie d'application dans le domaine de l'IA, contribuant à la compréhension de son fonctionnement, mais présentant également des risques d'abus.
Ingénierie inverse des invites : comment « tromper » l’IA pour lui faire révéler son invite ?
