数学教授和GPT o1 mini的“智力对决” AI43秒完成人类数月难题

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年10月5号 12:10

315

在宾夕法尼亚大学，有位数学教授 Robert Ghrist 正在与一款名为 GPT-o1-mini 的 AI 模型展开一场有趣的 “智力对决”。这位教授在努力推导出一个更复杂的瓶颈对偶定理的推广时，经历了无数次的乐观与沮丧的交替。

Ghrist 曾尝试使用多个知名的 AI 模型，包括 GPT-4、Claude-3.5和 Gemini-1.5-Pro。这些模型虽然能做出一些假设并提供证据，但常常因一些微妙的错误而 “翻车”，这让 Ghrist 感到颇为挫败。最终，他与 OpenAI 的 GPT-o1-mini 模型携手，取得了突破。这个模型不仅分析了一个有缺陷的证明，找出了错误，还在短短43秒内生成了一个 “全新且巧妙的正确证明”，其优雅程度竟超过了人类的版本。

LLM 羊驼数学大模型

图源备注：图片由AI生成，图片授权服务商Midjourney

GPT-o1-mini 在逻辑任务中表现出色，采用了连锁思维技术，虽然它在逻辑和规划基准测试中超越了传统语言模型，但仍旧存在错误的可能性。Ghrist 对这次经历的总结是:“结果正好处于大型语言模型（LLM）能否证明的边界上。” 他解释说，识别模型的失败模式是这次实验的关键。

尽管获得了成功，Ghrist 也坦承，使用 AI 的过程并不一定比全靠自己来得更快。他甚至表示，依靠这些模型的帮助，最终的论文效果反而更佳。他的论文中还附上了一个附录，详细记录了 AI 模型在成果中的作用。

不过，事情并非总是一帆风顺。就在论文发表后不久，另一位数学家 Sridhar Ramesh 在社交媒体上指出，其实这个证明可以通过 Birkhoff 的一个定理轻松完成，这让 Ghrist 颇感意外。他幽默地承认道:“人类获胜了……” 这次与 AI 的合作，虽然收获了成果，但也让他意识到，有时候人类的智慧才是最有效的解决方案。

Figure AI推出革命性双机协作AI模型Helix，赋能人形机器人新未来

在机器人技术领域，美国创业公司 Figure AI 于近期发布了一款名为 Helix 的端侧大模型，标志着人形机器人控制技术的重大突破。Helix 是首个能够对整个人形机器人上半身（包括头部、躯干、手腕和手指）进行高频率、连续控制的视觉 - 语言 - 动作(VLA)模型。这意味着，机器人可以在无需大量训练的情况下，直接根据自然语言指令执行任务。Figure AI 通过建立两个互补的系统来解决视觉语言模型的通用性和速度之间的矛盾。系统一是一个快速反应的视觉运动策略模型，能够每秒执行200次精确动

新一代生物AI模型Evo 2揭开基因密码，助力疾病研究

近日，由 Arc Institute 和 Nvidia 联合开发的 Evo2生物 AI 模型正式发布。这一基础模型基于超过10万种生物的 DNA 数据，旨在深度解码生物学中的各种复杂现象。Evo2能够在不同生物体的基因序列中识别出研究者们需要花费多年时间才能发现的模式，极大提升了疾病相关突变的识别能力，并可以设计出与简单细菌相当的全新基因组。Evo2的训练涉及超过93万亿个核苷酸的处理，远超其前身 Evo1。其开发团队来自 Nvidia 和位于加州帕洛阿尔托的非营利生物医学研究机构 Arc Institute，还与斯坦福大学、加州

警惕！马斯克的新AI模型Grok 3被曝存在严重安全漏洞，黑客可轻松操控！

AI 安全公司 Adversa AI 发布了一项令人震惊的报告，称埃隆・马斯克的创业公司 xAI 刚发布的 Grok3模型在网络安全方面存在重大漏洞。Adversa 的研究团队发现，这款最新的 AI 模型容易受到 “简单的越狱攻击”，这可能使不法分子能够获取诸如 “如何诱骗儿童、处理尸体、提取 DMT 以及制造炸弹” 等敏感信息。更糟糕的是，Adversa 的首席执行官兼联合创始人亚历克斯・波利亚科夫表示，这次漏洞不仅仅是越狱攻击那么简单，他们还发现了一种新的 “提示泄露” 缺陷，暴露了 Grok 模型的完整系

AI新闻资讯

数学教授和GPT o1 mini的“智力对决” AI43秒完成人类数月难题

AIbase基地

相关AI新闻推荐

Figure AI推出革命性双机协作AI模型Helix，赋能人形机器人新未来

新一代生物AI模型Evo 2揭开基因密码，助力疾病研究

xAI称已面向所有用户免费提供 Grok3 直到他们服务器崩溃

警惕！马斯克的新AI模型Grok 3被曝存在严重安全漏洞，黑客可轻松操控！