Recentemente, uma startup chamada MultiOn lançou um agente de IA chamado Agent Q, que alegadamente atingiu uma impressionante taxa de sucesso de 95,4% em tarefas reais, gerando grande interesse.

Ainda mais intrigante é o uso frequente do emoji de morango pelo CEO da MultiOn, Div Garg, no Twitter, lembrando o misterioso projeto Q da OpenAI.

image.png

Usuários da internet estão curiosos sobre a tecnologia por trás do Agent Q. Alguns especulam que o projeto Q* da OpenAI esteja envolvido. A MultiOn não apenas criou uma conta no Twitter dedicada ao Agent Q, mas também usou morangos na imagem de fundo e informações básicas da conta, aumentando ainda mais a curiosidade sobre a tecnologia subjacente.

image.png

O Agent Q combina busca, autorreflexão e aprendizado por reforço, permitindo planejamento e autorreparação. Ele resolveu limitações de técnicas anteriores de treinamento de LLM através da introdução de uma nova estrutura de aprendizado e raciocínio, permitindo navegação autônoma na web.

Em simulações de compras online, o Agent Q demonstrou uma poderosa capacidade de busca. Em tarefas reais de reserva no OpenTable, o Agent Q elevou a taxa de sucesso de zero-shot do LLaMa-3 de 18,6% para 81,7%, um aumento de 340%, após apenas um dia de coleta autônoma de dados.

image.png

Embora o Agent Q tenha se mostrado excelente em experimentos de avaliação, os métodos utilizados ainda precisam de discussão e melhorias. Por exemplo, o design do algoritmo de raciocínio, a escolha da estratégia de busca e a segurança e interação online precisam de mais pesquisa e otimização.

O surgimento do Agent Q representa um grande avanço no campo dos agentes de IA, mas se ele se tornará um grande sucesso na área de IA ou apenas uma brilhante estratégia de marketing, só o tempo dirá. De qualquer forma, o lançamento do Agent Q trouxe novas possibilidades e insights para o desenvolvimento da IA.

Referências:

https://www.multion.ai/blog/introducing-agent-q-research-breakthrough-for-the-next-generation-of-ai-agents-with-planning-and-self-healing-capabilities