最近,一家名为MultiOn的初创公司发布了一款名为Agent Q的智能体,号称在真实任务中达到了惊人的95.4%成功率,引起了广泛关注。
而更引人注目的是,MultiOn的CEO Div Garg在推特上频频使用草莓表情,让人不禁联想到OpenAI神秘的Q项目。
网友们对Agent Q背后的技术充满了好奇。有人猜测,这背后可能有OpenAI的Q*项目加持。MultiOn公司不仅给Agent Q开设了独立的推特账号,而且账号的背景图片和基本信息都与草莓有关,这无疑增加了人们对其背后技术的好奇。
Agent Q结合了搜索、自我反思和强化学习,能够进行规划和自我修复。它通过引入一种新的学习和推理框架,解决了之前LLM训练技术的局限性,使其能够实现自主网页导航。
在模拟网上商店的任务中,Agent Q展现了强大的搜索能力。而在Open Table的真实预订任务中,Agent Q更是将LLaMa-3的零样本成功率从18.6%提升至81.7%,分数提高比例达340%,而且仅经过了一天的自主数据收集。
虽然Agent Q在评估实验中表现出色,但目前所用的方法仍存在许多讨论和改进的空间。例如,推理算法的设计、搜索策略的选择以及在线安全与交互等方面都需要进一步研究和优化。
Agent Q的出现无疑是AI智能体领域的一大进步,但它是否能够成为AI界的新贵,还是仅仅是一次高明的炒作,还有待时间的检验。无论如何,Agent Q的发布都为AI的发展带来了新的可能性和启示。
参考资料:
https://www.multion.ai/blog/introducing-agent-q-research-breakthrough-for-the-next-generation-of-ai-agents-with-planning-and-self-healing-capabilities