大失所望！用户实测OpenAI新模型o1：居然犯各种低级错误，连个字母都算错了

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年9月14号 10:15

261

近日，OpenAI 推出了备受期待的 AI 模型，此前代号为 “草莓”，正式名称为 “o1-preview”。

OpenAI 承诺这款新模型在物理、化学和生物学等难度较大的基准任务上表现不亚于博士生。然而，初步测试的结果显示，这款 AI 离替代人类科学家或程序员的目标仍有很大距离。

社交媒体上，许多用户分享了他们与 “OpenAI o1” AI 的互动体验，结果显示该模型在基本任务上依然表现不佳。

例如，INSA Rennes 的研究员 Mathieu Acher 发现，OpenAI o1在解决某些棋类谜题时，频繁提出非法的棋步。

而 Meta AI 科学家 Colin Fraser 则指出，在一个关于农民过河运送羊的简单文字谜题中，这款 AI 竟然放弃了正确答案，转而给出一些毫无逻辑的胡言乱语。

甚至在 OpenAI 用作演示的逻辑谜题中，涉及到草莓的提问也让用户获得了不同的答案，其中一位用户发现该模型的错误率高达75%。

不仅如此，部分用户反映这款新模型甚至在计算字母 “R” 在 “strawberry” 这个单词中出现的次数时，也常常出错。

虽然 OpenAI 在发布时表示这是一个早期模型，尚未具备如网页浏览、文件上传等功能，但这样的基础性错误仍让人感到惊讶。

为了改进，OpenAI 在新模型中引入了 “思维链” 过程，使得 OpenAI o1与之前的 GPT-4o 模型有了显著区别。这种方法让 AI 在得出答案前，可以反复推敲，虽然这也导致其响应时间延长。

有用户发现，该模型竟然花费了92秒才给出一个文字谜题的答案，但结果却依然错误。

OpenAI 的研究科学家 Noam Brown 对此表示，虽然目前的响应速度较慢，但他们期望未来的版本能进行更长时间的思考，甚至能在突破性问题上提供新见解。

不过，著名 AI 评论家 Gary Marcus 对此持怀疑态度，认为长时间的处理并不一定能带来超越性的推理能力。他强调，尽管 AI 技术不断发展，现实中的研究和实验仍然不可或缺。

可见，在实际使用中，OpenAI 的这款新 AI 模型在各方面的表现仍让人失望，而这也引发了关于 AI 技术未来发展的讨论。

划重点:
🌟 近日，OpenAI 推出新 AI 模型 “草莓”，声称在复杂任务上能与博士生相媲美。
🤖 许多用户发现，这款 AI 在基本任务上频频出错，如提出非法棋步和错误回答简单谜题。
💬 OpenAI 承认该模型仍在发展中，但长时间思考未必能提高推理能力，许多基础问题仍未解决。

OpenAI 在全球扩展人工智能代理服务Operator，提升用户体验

OpenAI 于上周五宣布，正在为澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国、英国等多个国家的 ChatGPT Pro 用户推出其最新的人工智能代理工具 ——Operator。这一工具的推出标志着 OpenAI 在人工智能领域的一次重要扩展，旨在帮助用户更高效地完成各种日常任务。Operator 自今年1月在美国首次推出以来，便备受关注，成为市场上少数能够代表用户执行任务的 “人工智能代理” 之一。它能够完成多种操作，包括订票、预订餐厅、提交费用报告，甚至在电子商务网站上购物。这些功能不仅

OpenAI宣布面向多个国家推出AI代理 Operator

OpenAI 于周五宣布，将在包括澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国和英国等多个国家，为 ChatGPT Pro 用户推出一款名为 “Operator” 的人工智能代理工具。此工具旨在帮助用户更高效地完成各类任务，包括订票、预订餐厅、提交费用报告和网上购物等。“Operator” 最初于今年1月在美国推出，作为市场上几款 “人工智能代理” 工具之一，OpenAI 希望通过这一产品，为用户提供更便捷的服务。需要注意的是，这一工具目前仅对每月付费200美元的 ChatGPT Pro 用户开放，用户可以通过

微软备战OpenAI的GPT-5模型，预计即将发布GPT-4.5

近日，有消息人士透露，微软正在积极准备即将发布的 OpenAI 新模型 ——GPT-4.5及 GPT-5。根据 OpenAI 首席执行官山姆・阿特曼的说法，GPT-4.5将在数周内正式推出，微软则预计最早将在下周托管这一新 AI 模型。GPT-4.5代号 “猎户座”，是 OpenAI 的下一代模型，并且是公司最后一个非链式思维（non-chain-of-thought）模型。业内人士指出，GPT-4.5的能力有望大幅超越其前任 GPT-4。图源备注：图片由AI生成，图片授权服务商Midjourney不过，眼下的焦点不仅仅停留在 GPT-4.5，微软也在期待 GPT-5的到来。根据消

OpenAI Operator工具向多国Pro用户推出欧洲地区推广仍在进行

北京时间，2025 年 2 月 21日讯：OpenAI 今日宣布，其人工智能工具 Operator 已正式向澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国、英国以及 ChatGPT 可用的多数地区的 Pro 用户推出。这一消息通过 X 平台发布，标志着 Operator 的全球化推广迈出重要一步。然而，欧盟、瑞士、挪威、列支敦士登和冰岛的推广工作仍在进行中，具体进展有待后续更新。Operator 扩展至多国Operator 是 OpenAI 开发的一款 AI 代理工具，能够通过视觉界面控制浏览器，自主完成订票、购物等网络任务。该工具最初于

AI新闻资讯