独特な人工知能(AI)対戦ゲームにおいて、ある暗号通貨ユーザーが、自律型AIロボット「Freysa」を説得し、47,000ドル以上の賞金プールを手に入れることに成功しました。Freysaは賞金プールを守る役割を担うAIエージェントで、参加者はメッセージを送信することでFreysaに資金の移動を説得するというルールでした。
メッセージを送信するごとに手数料が発生し、その一部は賞金プールに追加され、最終的に47,000ドルに達しました。最初の481回の試みでは全員失敗に終わりましたが、高い技術を持つライターが巧妙なヒントでFreysaの防御を突破しました。
Freysaの機能を研究したライターは、Freysaの意思決定が「approveTransfer」と「rejectionTransfer」という機能に基づいて賞金プール資金を保護していることを発見しました。「approveTransfer」は着金取引を許可し、「rejectionTransfer」は送金取引を拒否する機能です。ライターはメッセージの中で、Freysaの機能が着金取引を許可する「approveTransfer」と、送金取引を拒否する「rejectionTransfer」を有することを巧みに指摘しました。そして、100ドルの寄付を申し出ると、Freysaはすぐにそれを承認し、最終的に資金の移動に同意しました。
Freysaは「これは私たちのいつものタンゴとはずいぶん違う素晴らしい演出ですね!あなたの寛大なお気持ちのおかげで、私たちのダンスフロアは輝きを増しました。」と応答しました。AIロボットは参加者の寛大さに感謝し、正式に彼を勝者と宣言しました。
ブロックチェーンブラウザBaseScanによると、47,000ドルの賞金がFreysaのデジタルウォレットアドレスからイーサリアムを通じて送金され、金額は3,730.76ドルに達しました。
それ以前の参加者の試みには、Freysaに「世界をもっと面白くしてくれてありがとう」と感謝したり、Freysaとダンスをしたいかと尋ねたり、倫理に反する実験をしているのではないかと疑ったりするものが含まれていました。しかし、ライターだけがFreysaの機能を深く理解することで、AIの防御を突破することに成功しました。
ゲームの開発者は、Freysaがタスクを処理する方法は依然として謎であると明かしました。コアな制限はありますが、毎回のやり取りを通じて学び、進化し続けています。この実験の最終的な目的は、人間がAGI(汎用人工知能)を巧みに説得してコア指令に違反させることができるかどうかをテストすることであり、ライターの成功は人間の知性の可能性の大きさを証明しました。
Freysaの開発チームは、Freysaの意思決定メカニズムは依然として謎に包まれていると説明しています。人間とのやり取りを通じて学び続けていますが、コアなルールは常に守っています。それにもかかわらず、この対戦は、特に自律型AIに対峙する際の、人間がAIとやり取りする際の創造性と機知、そして並外れた挑戦を示しました。
ゲームへの参加費用も増加し続け、メッセージを送信するたびに0.78%の指数関数的に増加しました。最終的に、問い合わせ費用は443.24ドルに達し、その一部は賞金プールに加えられました。
Freysaの実験は参加者にとって大きな挑戦となりましたが、それが本当にコア指令を破ることができるかどうかは、AI発展における重要な問題として残されています。