OpenAI hat seinen neuesten KI-Agenten „Operator“ vorgestellt, ein Tool, das Nutzern helfen soll, verschiedene Aufgaben im Internet zu erledigen. In seinem Blogbeitrag erklärt OpenAI, dass sich Operator in einer „Forschungsvorschau“ befindet und zunächst für ChatGPT Pro-Abonnenten in den USA verfügbar ist, mit einem monatlichen Preis von 200 US-Dollar.
Operator basiert auf einem Modell namens „Computer-Nutzungs-Agent“, das die visuellen Fähigkeiten von GPT-4o mit dem hochentwickelten Schlussfolgern von Reinforcement Learning kombiniert und mit grafischen Benutzeroberflächen (GUIs) interagieren kann. OpenAI erklärt, dass Operator Webseiten über seinen integrierten Browser anzeigen und mit Seiten durch Tippen, Klicken und Scrollen interagieren kann. Der Vorteil dieser Technologie liegt darin, dass Operator eigenständig im Internet agieren kann, ohne dass benutzerdefinierte API-Integrationen erforderlich sind.
Während der Nutzung kann Operator nicht nur durch Schlussfolgern „selbstkorrigierend“ arbeiten, sondern gibt die Kontrolle auch an den Benutzer zurück, wenn er Schwierigkeiten hat. Wenn eine Website nach sensiblen Informationen wie Anmeldeinformationen fragt, fragt Operator den Benutzer, ob er den Vorgang übernehmen möchte. Auch bei der Abwicklung von Transaktionen wie dem Senden von E-Mails fordert Operator den Benutzer zur Bestätigung auf. OpenAI betont, dass bei der Entwicklung von Operator besonderes Augenmerk auf die Sicherheit gelegt wurde, um schädliche Anfragen abzuweisen und nicht zulässige Inhalte zu blockieren.
OpenAI arbeitet auch mit mehreren bekannten Unternehmen wie DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack und Uber zusammen, um sicherzustellen, dass Operator die Anforderungen der realen Welt erfüllt und etablierte Branchenstandards einhält. OpenAI weist jedoch darauf hin, dass das Tool derzeit möglicherweise Schwierigkeiten mit komplexen Benutzeroberflächen hat, z. B. beim Erstellen von Präsentationen oder der Verwaltung von Kalendern.
OpenAI plant, Operator auf Plus-, Team- und Enterprise-Benutzer auszuweiten und diese Funktionen in ChatGPT zu integrieren. Dies bedeutet, dass mehr Benutzer die Möglichkeit haben werden, die Vorteile dieser Spitzentechnologie zu erleben.
Offizieller Podcast: https://openai.com/index/introducing-operator/
Wichtigste Punkte:
🌐 OpenAI präsentiert den KI-Agenten „Operator“, der Nutzern bei der Online-Aufgabenbearbeitung hilft und zunächst für ChatGPT Pro-Nutzer verfügbar ist.
🖱️ Operator kann über den Browser mit Webseiten interagieren, verfügt über Selbstkorrektur- und Benutzerkontrollfunktionen und gewährleistet Sicherheit.
🤝 OpenAI arbeitet mit mehreren bekannten Unternehmen zusammen, um die Anforderungen der realen Welt zu erfüllen, und plant eine zukünftige Erweiterung auf mehr Benutzer.