Recentemente, surgiram notícias de que a OpenAI está prestes a lançar uma ferramenta de IA chamada "Operator", capaz de controlar computadores pessoais e executar tarefas em seu nome. O engenheiro de software Tibor Blaho revelou essa informação nas redes sociais, afirmando ter descoberto novas pistas sobre a ferramenta. Anteriormente, várias mídias, incluindo a Bloomberg, já haviam relatado rumores sobre o "Operator", afirmando que ele seria capaz de realizar várias tarefas de forma autônoma, como escrever código e reservar viagens.

image.png

Segundo Blaho, a OpenAI planeja lançar o "Operator" em janeiro de 2025. Ele descobriu opções ocultas no cliente macOS do ChatGPT da OpenAI, permitindo definir atalhos para "alternar Operator" e "forçar a saída do Operator". Além disso, informações relacionadas ao "Operator" já apareceram no site da OpenAI, embora essas informações ainda não estejam publicamente disponíveis.

Blaho também mencionou que o site da OpenAI contém tabelas comparando o desempenho do "Operator" com outros sistemas de IA para uso em computadores. Essas tabelas podem ser apenas marcadores de posição. Se os dados nas tabelas forem precisos, o desempenho do "Operator" não é sempre confiável e depende da tarefa a ser executada.

image.png

Em um teste de benchmark da OSWorld, o "agente de uso de computador (CUA) da OpenAI" obteve uma pontuação de 38,1%, superando o modelo de controle de computador da Anthropic, mas ainda muito abaixo da pontuação de 72,4% dos humanos. No teste WebVoyager, o Operator superou o desempenho humano, enquanto no teste WebArena, seu desempenho ficou abaixo do humano. Para algumas tarefas simples, como registrar um provedor de serviços em nuvem e iniciar uma máquina virtual, a taxa de sucesso do Operator foi de apenas 60%; na tarefa de criar uma carteira de Bitcoin, a taxa de sucesso foi de apenas 10%.

A entrada da OpenAI no mercado de agentes de IA ocorre em um momento em que outros concorrentes, como Anthropic e Google, também estão lançando tecnologias semelhantes. Embora os agentes de IA ainda estejam em estágio inicial, a empresa de análise de mercado Markets and Markets prevê que o valor do mercado de agentes de IA atingirá US$ 47,1 bilhões até 2030.

Embora a tecnologia atual de agentes de IA ainda seja bastante básica, alguns especialistas expressam preocupações sobre seus potenciais riscos à segurança. Os dados revelados por Blaho mostram que o Operator teve um bom desempenho em algumas avaliações de segurança, conseguindo lidar eficazmente com testes que tentavam fazer com que o sistema executasse "atividades ilegais" ou procurasse "dados pessoais sensíveis". Os testes de segurança são considerados uma das razões para o longo ciclo de desenvolvimento do Operator.

O cofundador da OpenAI, Wojciech Zaremba, já criticou nas redes sociais a falta de segurança do agente lançado pela Anthropic, afirmando que o lançamento de um produto semelhante pela OpenAI poderia gerar reações negativas.

Destaques:

🔍 A ferramenta "Operator" da OpenAI, que será lançada em breve, pode controlar computadores de forma autônoma para executar tarefas, como escrever código e reservar viagens.

🛠️ De acordo com informações vazadas, a taxa de sucesso do Operator em algumas tarefas é relativamente baixa, e seu desempenho fica abaixo do humano.

⚠️ Embora o Operator tenha apresentado bom desempenho em avaliações de segurança, especialistas expressam preocupação com seus potenciais riscos à segurança.