近期,xAI工程师Hieu Pham在社交媒体上发布了一条“爆炸性”消息,声称xAI旗下的大语言模型Grok3成功证明了黎曼猜想,并因此暂停了模型的训练。这条消息迅速在AI圈引发热议,网友们纷纷表示震惊,难以分辨真假。毕竟,黎曼猜想作为千禧年七大数学难题之一,被誉为“猜想界的皇冠”,其难度可想而知。

image.png

几小时后,Pham在另一条帖子中揭晓了答案:这只是一场调侃。这场“乌龙”源于网友Andrew Curran的爆料,他声称Grok3在训练过程中遭遇了“灾难性事件”。

image.png

面对越传越离谱的谣言,xAI联创Greg Yang忍不住发文讽刺道,“对对对,Grok3训着训着就开始攻击办公室的保安了。”另一位研究人员Heinrich Kuttler也幽默地表示,“情况非常糟糕!我们后来用nan(Not a Number,非数)把所有坏的权重都替换了一遍,才恢复。”网友们见状也纷纷加入玩梗的行列。

image.png

虽然这场“闹剧”最终以玩笑收场,但也引发了人们对于AI数学能力的思考。

那么,AI究竟离攻克黎曼猜想这样的千禧年数学难题还有多远呢?

我们可以从谷歌DeepMind团队开发的AI数学证明工具AlphaProof的表现窥见一二。AlphaProof在2024年国际数学奥林匹克竞赛(IMO)中成功解出了三道题,其中第六题更是被誉为“终极boss”,难度极高。AlphaProof在解题过程中展现出了强大的逻辑推理能力和创造性思维,例如在第二题中,它巧妙地选择了考虑数ab+1来构建证明,这一策略与人类的解题思路不谋而合。

image.png

虽然AlphaProof取得了令人瞩目的成绩,但要想攻克黎曼猜想这样的顶级数学难题,AI还有很长的路要走。黎曼猜想自1859年提出至今,已有165年的历史,无数数学家为之倾尽心血,但始终未能彻底证明。

AI要证明黎曼猜想,需要具备强大的计算能力和深度推理能力。目前,AI可以通过穷举法搜索所有可能的证明来找到可证明的定理,但这需要天文数字般的计算资源。此外,AI还需要具备理解和应用现有数学工具的能力,才能在数学研究中发挥更大的作用。

一些AI专家预测,到2026年底,AI将成为“超人数学家”,足以解决黎曼猜想等难题。马斯克也曾许诺,用20万台H100训练的Grok3将在年底发布,并将带来令人惊叹的表现。

未来,AI能否在数学领域取得突破性进展,让我们拭目以待。