Des rumeurs récentes suggèrent qu'OpenAI s'apprête à lancer un outil d'IA nommé "Operator", capable de contrôler un ordinateur personnel et d'exécuter des tâches à sa place. L'ingénieur logiciel Tibor Blaho a révélé cette information sur les réseaux sociaux, affirmant avoir découvert de nouveaux indices concernant cet outil. Auparavant, plusieurs médias, dont Bloomberg, avaient déjà rapporté des rumeurs concernant "Operator", affirmant qu'il pouvait accomplir de nombreuses tâches de manière autonome, telles que la rédaction de code et la réservation de voyages.
Selon Blaho, OpenAI prévoit de lancer "Operator" en janvier 2025. Il a découvert des options cachées dans le client macOS de ChatGPT d'OpenAI, permettant de définir des raccourcis clavier pour "Activer Operator" et "Forcer la fermeture d'Operator". De plus, des informations concernant "Operator" sont apparues sur le site web d'OpenAI, bien que ces informations ne soient pas encore publiques.
Blaho a également mentionné la présence sur le site web d'OpenAI de tableaux comparant les performances d'Operator avec d'autres systèmes d'IA pour l'utilisation d'ordinateurs. Ces tableaux pourraient n'être que des espaces réservés. Si les données de ces tableaux sont exactes, les performances d'Operator ne seraient pas toujours fiables et dépendraient de la tâche à exécuter.
Lors d'un test de référence d'OSWorld, l'"agent d'utilisation d'ordinateur (CUA)" d'OpenAI a obtenu un score de 38,1 %, dépassant ainsi le modèle de contrôle informatique d'Anthropic, mais restant bien en deçà du score humain de 72,4 %. Dans les tests WebVoyager, Operator a surpassé les performances humaines, tandis que dans les tests WebArena, il a été moins performant. Pour certaines tâches simples, telles que l'inscription auprès d'un fournisseur de services cloud et le démarrage d'une machine virtuelle, le taux de réussite d'Operator n'était que de 60 % ; pour la création d'un portefeuille Bitcoin, il n'était que de 10 %.
L'entrée d'OpenAI sur le marché des agents d'IA intervient alors que d'autres concurrents, tels qu'Anthropic et Google, lancent également des technologies similaires. Bien que les agents d'IA en soient encore à leurs débuts, la société d'analyse de marché Markets and Markets prévoit que la valeur du marché des agents d'IA atteindra 47,1 milliards de dollars d'ici 2030.
Bien que la technologie actuelle des agents d'IA soit encore assez rudimentaire, certains experts s'inquiètent de ses risques potentiels pour la sécurité. Les données révélées par Blaho montrent qu'Operator a bien réussi certains tests d'évaluation de sécurité, réussissant à contrer les tentatives de faire exécuter au système des "activités illégales" ou de rechercher des "données personnelles sensibles". Les tests de sécurité sont considérés comme l'une des raisons de la durée de développement d'Operator.
Le cofondateur d'OpenAI, Wojciech Zaremba, a critiqué sur les réseaux sociaux le manque de sécurité des agents publiés par Anthropic, affirmant qu'une publication similaire d'OpenAI pourrait entraîner des réactions négatives.
Points clés :
🔍 L'outil "Operator" qu'OpenAI s'apprête à lancer peut contrôler un ordinateur de manière autonome pour exécuter des tâches telles que la rédaction de code et la réservation de voyages.
🛠️ Selon les informations divulguées, le taux de réussite d'Operator est relativement faible pour certaines tâches, et ses performances sont inférieures à celles des humains.
⚠️ Bien qu'Operator ait bien réussi les évaluations de sécurité, les experts s'inquiètent de ses risques potentiels pour la sécurité.