近日,Verses 团队研发的 Genius 智能体在经典游戏 Pong 中创造了惊人佳绩,仅用10% 的数据和2小时的训练时间,便超越了顶尖人类玩家和其他 AI 模型。这一突破性进展标志着 AI 技术的全新里程碑,预示着未来智能体的发展方向。

Genius 智能体的成功离不开其独特的设计理念。与传统的大型模型相比,Genius 的规模仅为 SOTA 模型 IRIS 的4%,并且能够在普通的 M1芯片的 MacBook 上运行。研究人员的灵感来源于四年前的实验,科学家们发现培养的 “盘中大脑” 能在短短5分钟内学会 Pong 游戏,这引发了他们对模仿人脑工作方式的思考。

机器人 人工智能 AI

图源备注:图片由AI生成,图片授权服务商Midjourney

Verses 团队认为,传统的基于大模型的 AI 智能体在逻辑推理方面存在严重不足。现有的模型更多地依赖于记忆训练数据中的推理步骤,缺乏真正的主动性和好奇心。Genius 智能体采用了认知引擎的概念,不仅具备认知、推理和决策能力,还赋予了智能体主动学习的能力。

在与 IRIS 和其他 AI 模型的对比测试中,Genius 展现出强大的学习能力。研究者在2小时内用1万步的游戏数据对 Genius 进行了训练,结果显示其表现超过了训练两天的 IRIS。Genius 的成功不仅在于快速学习能力,更在于其在游戏中的主动表现。例如,在 Pong 比赛中,Genius 在落后情况下仍能逆转获胜,这一现象在 IRIS 的训练中未曾出现。

不过,研究者们也提醒,尽管 Genius 的表现令人振奋,但目前尚缺乏能够全面衡量 AGI 表现的统一标准,需要进行多样化测试来验证其在不同领域的适应性与可靠性。

这一研究成果不仅推动了 AI 智能体的发展,也为未来的机器智能探索提供了新的思路和方法。

论文地址:https://arxiv.org/pdf/2410.05229