谷歌最近在紧锣密鼓地准备推出他们的最新语言模型 Gemini2.0,预计将在12月份与大家见面。根据来自《The Verge》的消息来源,尽管 Gemini2.0可能不会带来我们期待的重大性能提升,但还是会推出一些有趣的新功能。与此同时,有消息称一些商业客户已经提前获得了这个新模型的使用权限。
在 AI 领域,其他公司也在积极推进自的项目。比如,埃隆・马斯克的 xAI 利用在其孟菲斯超级计算中心的100,000个 Nvidia H100芯片来训练 Grok3,而 Meta 则在用更多的计算资源训练 Llama4。
谷歌在其旗舰语言模型上的进展不尽如人意,这或许是他们近期以高达25亿美元收购 Character.ai 的原因,主要是为了引进著名的 AI 研究员诺亚・沙泽尔及其团队。沙泽尔曾在2017年共同开发了 Transformer 架构,现在他据说正在谷歌研究一种新的推理模型,以此来与 OpenAI 的 o1进行竞争。
当前的研究者们希望,通过在推理阶段(即 AI 处理信息的过程)使用更多的资源,而不是主要依赖于大数据集的预训练,能够实现更好的效果,并开辟出一个新的扩展视野。
过去两年里,AI 语言模型虽然变得更高效,但能力的提升却并不明显,这让人们开始担心当前方法可能面临瓶颈。比尔・盖茨也表示,从 GPT-4到 GPT-5的进步,可能会比以往的升级小得多。
此外,最近不同模型的性能趋于相似,这使得语言模型可能变成一种没有明显差异的商品,尽管开发和运营成本依旧高昂。当前语言模型的表现正在接近一个共同水平,而早期模型之间的差异正在缩小,这也表明现有模型架构可能已经达到性能平台期。
与此同时,OpenAI 最近确认,内部被视为潜在继任者的 GPT-4新模型将不会在今年发布,尽管谷歌 Gemini2.0即将面临激烈的竞争。同样,Anthropic 也传出消息,旗下旗舰 Opus 模型的版本3.5因缺乏显著进展而被搁置,转而专注于更优版本的 Sonnet3.5。
划重点:
🔍 谷歌 Gemini2.0预计将在12月份发布,可能不会带来大幅性能提升,但会有新功能。
🤖 其他科技公司如 xAI 和 Meta 也在积极推进各自的 AI 项目,竞争加剧。
📉 AI 语言模型的性能趋于一致,行业面临增长乏力的挑战,或进入平台期。