Neuigkeiten deuten darauf hin, dass OpenAI in Kürze ein KI-Tool namens „Operator“ auf den Markt bringen wird. Dieses Tool soll in der Lage sein, persönliche Computer zu steuern und Aufgaben im Auftrag des Benutzers auszuführen. Der Softwareentwickler Tibor Blaho gab diese Information in den sozialen Medien bekannt und berichtete über neue Hinweise auf das Tool. Zuvor hatten bereits mehrere Medien, darunter Bloomberg, über „Operator“ berichtet und dessen Fähigkeit, Aufgaben wie das Schreiben von Code und die Buchung von Reisen selbstständig zu erledigen, erwähnt.

image.png

Laut Blaho plant OpenAI die Veröffentlichung von „Operator“ für Januar 2025. Er entdeckte versteckte Optionen im ChatGPT macOS-Client von OpenAI, mit denen Tastenkombinationen für „Operator umschalten“ und „Operator beenden“ definiert werden können. Darüber hinaus sind bereits Informationen zu „Operator“ auf der OpenAI-Website aufgetaucht, obwohl diese derzeit noch nicht öffentlich zugänglich sind.

Blaho erwähnte außerdem Tabellen auf der OpenAI-Website, die den Vergleich der Leistung von „Operator“ mit anderen KI-Systemen zur Computerbedienung zeigen. Diese Tabellen könnten jedoch nur Platzhalter sein. Wenn die Daten in den Tabellen korrekt sind, scheint die Leistung von „Operator“ nicht immer zuverlässig zu sein und hängt von der jeweiligen Aufgabe ab.

image.png

In einem Benchmark-Test von OSWorld erreichte der „OpenAI Computer Usage Agent (CUA)“ einen Wert von 38,1 %. Dies übertrifft zwar das Computerkontrollmodell von Anthropic, liegt aber deutlich unter dem menschlichen Ergebnis von 72,4 %. Im WebVoyager-Test übertraf Operator die menschliche Leistung, während es im WebArena-Test schlechter abschnitt. Bei einfachen Aufgaben wie der Registrierung bei einem Cloud-Anbieter und dem Starten einer virtuellen Maschine lag die Erfolgsrate von Operator bei nur 60 %, während die Erfolgsrate bei der Erstellung einer Bitcoin-Wallet bei lediglich 10 % lag.

OpenAI betritt den Markt für KI-Agenten zu einem Zeitpunkt, an dem auch Wettbewerber wie Anthropic und Google ähnliche Technologien entwickeln. Obwohl sich KI-Agenten noch in einem frühen Stadium befinden, prognostiziert das Marktforschungsunternehmen Markets and Markets einen Marktwert von 47,1 Milliarden US-Dollar bis 2030.

Obwohl die derzeitigen KI-Agenten-Technologien noch relativ grundlegend sind, äußern einige Experten Bedenken hinsichtlich potenzieller Sicherheitsrisiken. Die von Blaho bekannt gegebenen Daten zeigen, dass Operator in einigen Sicherheitstests gut abschnitt und Versuche, das System zu illegalen Aktivitäten oder der Suche nach sensiblen persönlichen Daten zu bewegen, effektiv abwehren konnte. Sicherheitstests werden als einer der Gründe für die längere Entwicklungszeit von Operator genannt.

Der OpenAI-Mitbegründer Wojciech Zaremba kritisierte in den sozialen Medien die mangelnde Sicherheit des von Anthropic veröffentlichten Agenten und erklärte, dass die Veröffentlichung eines ähnlichen Produkts durch OpenAI negative Reaktionen hervorrufen könnte.

Wichtigste Punkte:

🔍 Das kommende OpenAI-Tool „Operator“ kann Computer autonom steuern und Aufgaben wie das Schreiben von Code und die Buchung von Reisen ausführen.

🛠️ Laut durchgesickerten Informationen ist die Erfolgsrate von Operator bei einigen Aufgaben relativ niedrig und die Leistung unterliegt der menschlichen Leistung.

⚠️ Obwohl Operator in Sicherheitstests gut abschnitt, äußern Experten Bedenken hinsichtlich potenzieller Sicherheitsrisiken.