Genius智能体用10%数据和2小时训练击败人类玩家

近日，Verses 团队研发的 Genius 智能体在经典游戏 Pong 中创造了惊人佳绩，仅用10% 的数据和2小时的训练时间，便超越了顶尖人类玩家和其他 AI 模型。这一突破性进展标志着 AI 技术的全新里程碑，预示着未来智能体的发展方向。

Genius 智能体的成功离不开其独特的设计理念。与传统的大型模型相比，Genius 的规模仅为 SOTA 模型 IRIS 的4%，并且能够在普通的 M1芯片的 MacBook 上运行。研究人员的灵感来源于四年前的实验，科学家们发现培养的 “盘中大脑” 能在短短5分钟内学会 Pong 游戏，这引发了他们对模仿人脑工作方式的思考。

机器人人工智能 AI

图源备注：图片由AI生成，图片授权服务商Midjourney

Verses 团队认为，传统的基于大模型的 AI 智能体在逻辑推理方面存在严重不足。现有的模型更多地依赖于记忆训练数据中的推理步骤，缺乏真正的主动性和好奇心。Genius 智能体采用了认知引擎的概念，不仅具备认知、推理和决策能力，还赋予了智能体主动学习的能力。

在与 IRIS 和其他 AI 模型的对比测试中，Genius 展现出强大的学习能力。研究者在2小时内用1万步的游戏数据对 Genius 进行了训练，结果显示其表现超过了训练两天的 IRIS。Genius 的成功不仅在于快速学习能力，更在于其在游戏中的主动表现。例如，在 Pong 比赛中，Genius 在落后情况下仍能逆转获胜，这一现象在 IRIS 的训练中未曾出现。

不过，研究者们也提醒，尽管 Genius 的表现令人振奋，但目前尚缺乏能够全面衡量 AGI 表现的统一标准，需要进行多样化测试来验证其在不同领域的适应性与可靠性。

这一研究成果不仅推动了 AI 智能体的发展，也为未来的机器智能探索提供了新的思路和方法。

论文地址：https://arxiv.org/pdf/2410.05229

AI新闻资讯

Genius智能体用10%数据和2小时训练击败人类玩家

AIbase基地

相关AI新闻推荐

Minecraft中出现新型学习型人工智能：AIRIS 的自主智能强化推断符号

爱尔兰超过四分之一的雇主已在招聘使用人工智能

AI新闻资讯

Genius智能体用10%数据和2小时训练击败人类玩家

AIbase基地

相关AI新闻推荐

Minecraft中出现新型学习型人工智能：AIRIS 的自主智能强化推断符号

​爱尔兰超过四分之一的雇主已在招聘使用人工智能

爱尔兰超过四分之一的雇主已在招聘使用人工智能