最近、MultiOnというスタートアップ企業がAgent Qというエージェントを発表し、現実のタスクで驚異の95.4%の成功率を達成したと発表し、大きな注目を集めています。

さらに注目すべきは、MultiOnのCEOであるDiv Garg氏がTwitterで頻繁にイチゴの絵文字を使用していることで、OpenAIの謎のQプロジェクトを連想させます。

image.png

ネットユーザーはAgent Qの技術的背景に強い関心を寄せています。OpenAIのQ*プロジェクトが関わっているのではないかという憶測もあります。MultiOn社はAgent Q専用のTwitterアカウントを開設し、その背景画像や基本情報にもイチゴが関連付けられており、技術的背景への好奇心をさらに煽っています。

image.png

Agent Qは、検索、自己省察、強化学習を組み合わせ、計画と自己修復を行うことができます。新しい学習と推論のフレームワークを導入することで、従来のLLMトレーニング技術の限界を克服し、自律的なウェブナビゲーションを実現しています。

オンラインストアを模擬したタスクでは、Agent Qは強力な検索能力を示しました。OpenTableでの実際の予約タスクでは、LLaMa-3のゼロショット成功率を18.6%から81.7%に、実に340%も向上させました。しかも、わずか1日の自律的なデータ収集で達成したのです。

image.png

Agent Qは評価実験で優れた性能を示しましたが、現在使用されている手法には、議論の余地があり、改善の余地もたくさんあります。例えば、推論アルゴリズムの設計、検索戦略の選択、オンラインでの安全性とインタラクションなどは、さらなる研究と最適化が必要です。

Agent Qの登場は、AIエージェント分野における大きな進歩と言えるでしょう。しかし、それがAI界の新たな寵児となるのか、それとも巧妙な宣伝に過ぎないのかは、まだ時間が必要です。いずれにせよ、Agent Qの発表はAIの発展に新たな可能性と示唆を与えてくれました。

参考文献:

https://www.multion.ai/blog/introducing-agent-q-research-breakthrough-for-the-next-generation-of-ai-agents-with-planning-and-self-healing-capabilities