在近期的一次 Reddit 问答中,OpenAI 的首席执行官山姆・阿尔特曼(Sam Altman)坦承,计算能力的不足是公司无法频繁推出新产品的主要原因之一。他表示,当前的 AI 模型越来越复杂,OpenAI 在如何分配计算资源以实现众多优秀想法方面面临许多限制和艰难的决定。
据多方报道,OpenAI 在获得足够的计算基础设施方面遇到了困难。本周,路透社援引消息人士的消息称,OpenAI 正在与博通(Broadcom)合作,开发用于运行其模型的 AI 芯片,预计这一芯片将在2026年之前问世。
由于计算能力的紧张,阿尔特曼透露,ChatGPT 的高级语音模式(Advanced Voice Mode)中原本计划的视觉能力将不会在短期内推出。早在四月的发布会上,OpenAI 展示了其 ChatGPT 应用在智能手机上运行,并能够识别摄像头视野中人们穿着的衣物等视觉信息。然而,有报道指出,这一演示是为了抢夺谷歌 I/O 开发者大会的关注,许多 OpenAI 内部员工认为 GPT-4o 并没有准备好被公开。
在问答中,阿尔特曼提到,OpenAI 的图像生成器 DALL-E 的下一次重大更新尚无发布日期。同时,OpenAI 的视频生成工具 Sora 由于需要完善模型、确保安全性以及扩大计算能力而受到延迟。Sora 在技术上也遭遇了一些挫折,使其在与 Luma、Runway 等竞争对手的较量中处于劣势。
另外,在10月时,Sora 的联合负责人 Tim Brooks 已离职前往谷歌。阿尔特曼在问答中提到,OpenAI 仍在考虑是否在 ChatGPT 中允许 “成人内容” 出现,并表示公司目前的首要任务是提升 o1系列 “推理” 模型及其后续版本的性能。在本周的 DevDay 大会上,OpenAI 展示了一些即将推出的新功能,包括图像理解。
阿尔特曼总结道:“我们将在今年晚些时候推出一些非常不错的新版本,但我们不会称之为 GPT-5。”
划重点:
🌐 OpenAI CEO 表示,计算能力不足是产品发布延迟的主要原因。
💻 公司正在与博通合作开发 AI 芯片,预计在2026年问世。
📅 DALL-E 和 Sora 等产品的更新没有明确的发布时间。