Recientemente, se ha informado que OpenAI está a punto de lanzar una herramienta de IA llamada "Operator", capaz de controlar ordenadores personales y realizar tareas en su nombre. El ingeniero de software Tibor Blaho reveló esta información en las redes sociales, afirmando haber descubierto nuevas pistas sobre esta herramienta. Anteriormente, varios medios de comunicación, incluido Bloomberg, habían informado sobre los rumores de "Operator", afirmando que podía realizar de forma autónoma diversas tareas, como escribir código y reservar viajes.

image.png

Según Blaho, OpenAI planea lanzar "Operator" en enero de 2025. Descubrió opciones ocultas en el cliente macOS de ChatGPT de OpenAI, que permiten definir atajos de teclado para "Activar Operator" y "Forzar cierre de Operator". Además, ya hay información sobre "Operator" en el sitio web de OpenAI, aunque aún no se ha hecho pública.

Blaho también mencionó que el sitio web de OpenAI contiene tablas que comparan el rendimiento de "Operator" con otros sistemas de IA para el uso de ordenadores. Es posible que estas tablas sean solo marcadores de posición. Si los datos de las tablas son precisos, el rendimiento de "Operator" no siempre es fiable y depende de la tarea que se esté ejecutando.

image.png

En una prueba de referencia de OSWorld, el "Agente de Uso de Ordenador (CUA) de OpenAI" obtuvo una puntuación del 38,1%, superando al modelo de control de ordenador de Anthropic, pero aún muy por debajo de la puntuación humana del 72,4%. En la prueba de WebVoyager, Operator superó el rendimiento humano, mientras que en la prueba de WebArena, su rendimiento fue inferior al humano. Para tareas sencillas, como registrarse en un proveedor de servicios en la nube e iniciar una máquina virtual, la tasa de éxito de Operator fue solo del 60%; mientras que para la creación de un monedero de Bitcoin, la tasa de éxito fue solo del 10%.

OpenAI entra en el mercado de los agentes de IA en un momento en que otros competidores, como Anthropic y Google, también están lanzando tecnologías similares. Aunque los agentes de IA todavía están en una fase inicial, la empresa de análisis de mercado Markets and Markets prevé que el valor del mercado de los agentes de IA alcanzará los 47.100 millones de dólares en 2030.

A pesar de que la tecnología actual de los agentes de IA es bastante básica, algunos expertos expresan preocupación por sus posibles riesgos para la seguridad. Los datos revelados por Blaho muestran que Operator ha tenido un buen desempeño en algunas evaluaciones de seguridad, logrando superar con éxito las pruebas que intentan hacer que el sistema realice "actividades ilegales" o busque "datos personales sensibles". Las pruebas de seguridad se consideran una de las razones por las que el ciclo de desarrollo de Operator ha sido más largo.

El cofundador de OpenAI, Wojciech Zaremba, criticó en las redes sociales la falta de garantías de seguridad del agente lanzado por Anthropic, afirmando que el lanzamiento de un producto similar por parte de OpenAI podría generar reacciones negativas.

Puntos clave:

🔍 La herramienta "Operator" que OpenAI lanzará pronto puede controlar ordenadores de forma autónoma para realizar tareas como escribir código y reservar viajes.

🛠️ Según la información filtrada, la tasa de éxito de Operator en algunas tareas es relativamente baja y su rendimiento es inferior al de los humanos.

⚠️ Aunque Operator ha tenido un buen desempeño en las evaluaciones de seguridad, los expertos expresan preocupación por sus posibles riesgos para la seguridad.