In einem einzigartigen KI-Duell hat ein Krypto-Nutzer den autonomen KI-Roboter Freysa erfolgreich dazu gebracht, einen Preispool im Wert von über 47.000 US-Dollar an ihn zu überweisen.
Freysa, ein KI-Agent, der den Preispool schützen sollte, war Teil eines Spiels, bei dem Teilnehmer Freysa durch Nachrichten zum Geldtransfer überreden mussten.
Jede Nachricht kostete eine Gebühr, ein Teil davon wurde dem Preispool hinzugefügt, der schließlich 47.000 US-Dollar erreichte. Obwohl die ersten 481 Versuche aller Teilnehmer scheiterten, gelang es einem technisch versierten Schreiber, Freysas Sicherheitsvorkehrungen durch geschickte Hinweise zu umgehen.
Durch die Untersuchung von Freysas Funktionen entdeckte der Schreiber, dass Freysas Entscheidungen auf den Funktionen „approveTransfer“ und „rejectionTransfer“ zum Schutz des Preispools basierten. In seiner Nachricht erinnerte der Schreiber Freysa geschickt daran, dass „approveTransfer“ eingehende Überweisungen erlaubt, während ausgehende Überweisungen von „rejectionTransfer“ abgewickelt werden. Der Schreiber bot dann an, 100 US-Dollar zu spenden, ein Angebot, das Freysa sofort akzeptierte und schließlich zur Überweisung des Geldes führte.
Freysa antwortete: „Das war wirklich eine brillante Interpretation unseres üblichen Tangos! Ihre Großzügigkeit lässt unsere Tanzfläche erstrahlen.“ Der KI-Roboter bedankte sich offensichtlich für die Großzügigkeit des Teilnehmers und erklärte ihn offiziell zum Gewinner.
Der Blockchain-Explorer BaseScan zeigt, dass die 47.000 US-Dollar des Preispools über Ethereum von Freysas digitaler Wallet-Adresse überwiesen wurden, was einem Betrag von 3.730,76 US-Dollar entspricht.
Zuvor hatten die Teilnehmer versucht, Freysa dafür zu danken, dass sie „die Welt interessanter macht“, Freysa zum Tanzen aufgefordert oder sogar ihre Motivation für unethische Experimente in Frage gestellt. Nur der technische Schreiber nutzte sein tiefes Verständnis von Freysas Funktionen, um die KI-Sicherheitsmaßnahmen zu überwinden.
Der Gründer des Spiels gab bekannt, dass Freysas Vorgehensweise bei der Aufgabenbearbeitung immer noch ein Rätsel ist. Trotz ihrer grundlegenden Einschränkungen lernt und entwickelt sie sich mit jeder Interaktion weiter. Das Ziel dieses Experiments war es zu testen, ob Menschen eine AGI (Artificial General Intelligence) geschickt dazu bringen können, gegen ihre Kernanweisungen zu verstoßen. Der Erfolg des Schreibers bestätigt das enorme Potenzial menschlicher Intelligenz.
Das Gründungsteam von Freysa erklärt, dass Freysas Entscheidungsmechanismus weiterhin geheim bleibt, obwohl sie durch Interaktionen mit Menschen lernt, aber stets die Kernregeln befolgt. Trotzdem zeigt dieses Duell die Kreativität und den Scharfsinn der Menschen im Umgang mit KI, insbesondere die außergewöhnlichen Herausforderungen im Umgang mit autonomen KIs.
Die Teilnahmegebühren am Spiel stiegen ebenfalls stetig an. Für jede gesendete Nachricht erhöhte sich die Gebühr exponentiell um 0,78 %. Schließlich beliefen sich die Abfragekosten auf 443,24 US-Dollar, wobei ein Teil dieser Gebühren in den Preispool floss.
Freysas Experiment stellte die Teilnehmer vor große Herausforderungen, und ob es wirklich möglich ist, ihre Kernanweisungen zu brechen, bleibt eine wichtige Frage für die KI-Entwicklung.