OpenAI a annoncé le lancement de son dernier agent IA, « Operator », un outil conçu pour aider les utilisateurs à effectuer diverses tâches sur le Web. Dans son blog, OpenAI précise qu'Operator est en « préversion de recherche » et initialement accessible aux abonnés ChatGPT Pro aux États-Unis, pour un coût mensuel de 200 dollars.
Operator est conçu selon un modèle d'« agent d'utilisation informatique », combinant les capacités visuelles de GPT-4o et le raisonnement avancé de l'apprentissage par renforcement, permettant ainsi l'interaction avec les interfaces graphiques utilisateur (GUI). OpenAI explique qu'Operator peut consulter des pages Web via son navigateur intégré et interagir avec elles en tapant, en cliquant et en faisant défiler. L'avantage de cette technologie réside dans la capacité d'Operator à agir de manière autonome sur le Web sans nécessiter d'intégration d'API personnalisée.
Lors de son utilisation, Operator peut non seulement se « corriger » lui-même grâce à ses capacités de raisonnement, mais il restitue également le contrôle à l'utilisateur en cas de difficulté. Lorsqu'un site Web demande des informations sensibles, telles que des identifiants de connexion, Operator demande à l'utilisateur s'il souhaite prendre le contrôle de l'opération. De même, Operator demande une confirmation de l'utilisateur pour les tâches telles que l'envoi d'e-mails. OpenAI souligne que la sécurité est au cœur de la conception d'Operator, qui est conçu pour refuser les demandes malveillantes et bloquer les contenus non autorisés.
OpenAI a également révélé qu'Operator collabore avec plusieurs entreprises de renom, telles que DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack et Uber, afin de garantir qu'il répond aux besoins du monde réel et respecte les normes industrielles établies. Cependant, OpenAI avertit que l'outil peut rencontrer des difficultés avec les interfaces complexes, telles que la création de diaporamas ou la gestion de calendriers.
OpenAI prévoit d'étendre Operator aux utilisateurs Plus, Team et Enterprise, et d'intégrer ces fonctionnalités à ChatGPT. Cela signifie que davantage d'utilisateurs auront l'opportunité de profiter de la commodité offerte par cette technologie de pointe.
Podcast officiel : https://openai.com/index/introducing-operator/
Points clés :
🌐 OpenAI lance « Operator », un agent IA intelligent qui aide les utilisateurs à effectuer des tâches en ligne, initialement pour les utilisateurs ChatGPT Pro.
🖱️ Operator peut interagir avec les pages Web via un navigateur, dispose de fonctions d'autocorrection et de contrôle utilisateur, garantissant ainsi la sécurité.
🤝 OpenAI collabore avec plusieurs grandes entreprises pour répondre aux besoins réels et prévoit une extension à davantage d'utilisateurs à l'avenir.