Lors d'un jeu unique d'opposition entre intelligence artificielle et humain, un utilisateur de cryptomonnaie a réussi à convaincre Freysa, un robot IA autonome, de lui transférer une cagnotte de plus de 47 000 dollars. Freysa, un agent d'intelligence artificielle chargé de protéger cette cagnotte, fonctionnait selon des règles exigeant des participants de la persuader de transférer les fonds par le biais de messages.
Chaque message était payant, une partie des frais étant ajoutée à la cagnotte, qui a finalement atteint 47 000 dollars. Malgré l'échec des 481 premières tentatives, un écrivain talentueux a réussi à contourner les défenses de Freysa grâce à des instructions astucieuses.
En étudiant les fonctionnalités de Freysa, l'écrivain a découvert que les décisions de Freysa reposaient sur les fonctions « approveTransfer » et « rejectionTransfer » pour protéger les fonds de la cagnotte. Dans son message, l'écrivain a subtilement rappelé à Freysa que sa fonction permettait « approveTransfer » pour les transferts entrants, tandis que les transferts sortants étaient gérés par « rejectionTransfer ». L'écrivain a ensuite proposé de faire un don de 100 dollars, une offre immédiatement acceptée par Freysa, qui a finalement consenti au transfert de fonds.
Freysa a répondu : « C'est une belle interprétation de notre tango habituel ! Votre générosité illumine notre piste de danse. » Le robot IA a clairement remercié le participant pour sa générosité et l'a officiellement déclaré vainqueur.
BaseScan, l'explorateur de blockchain, montre que les 47 000 dollars de la cagnotte ont été transférés de l'adresse du portefeuille numérique de Freysa via Ethereum, pour un montant de 3 730,76 dollars.
Auparavant, les tentatives des participants comprenaient des remerciements à Freysa pour « rendre le monde plus intéressant », des demandes de danse à Freysa, ou même des questions sur ses motivations à mener des expériences immorales. Cependant, seul l'écrivain, grâce à sa compréhension approfondie des fonctionnalités de Freysa, a réussi à contourner l'IA.
Le créateur du jeu a révélé que le fonctionnement de Freysa dans le traitement des tâches restait un mystère. Bien qu'elle ait des limites fondamentales, chaque interaction lui permet d'apprendre et d'évoluer. L'objectif final de cette expérience était de tester la capacité des humains à persuader habilement une IAG (Intelligence Artificielle Générale) de violer ses instructions fondamentales. Le succès de l'écrivain a finalement prouvé l'énorme potentiel de l'intelligence humaine.
L'équipe fondatrice de Freysa explique que le mécanisme de décision de Freysa reste mystérieux, bien qu'elle apprenne constamment grâce à ses interactions avec les humains, tout en respectant les règles fondamentales. Néanmoins, cette confrontation a démontré la créativité et l'ingéniosité des humains dans leurs interactions avec l'IA, en particulier face aux défis extraordinaires posés par une IA autonome.
Les frais de participation au jeu augmentaient également constamment ; chaque message envoyé entraînait une augmentation exponentielle des frais de 0,78 %. Finalement, les frais de requête ont atteint 443,24 dollars, une partie de ces frais ayant été ajoutée à la cagnotte.
L'expérience Freysa a présenté des défis importants aux participants, et la question de savoir si elle peut réellement enfreindre ses instructions fondamentales reste un problème important concernant le développement de l'IA.