OpenAI 推出了全新的模型系列 OpenAI o1,这个新模型在推理能力上表现得更加出色,相较于之前的模型,它的表现令人期待。

image.png

OpenAI o1:更强的推理能力

这是一系列全新的推理模型,旨在帮助解决复杂问题。这些模型经过特别训练,可以在作出回应之前,花更多时间进行思考,能够在科学、编码和数学等领域解决比以往更具挑战性的问题,OpenAI o1将先在 ChatGPT 和 API 上推出。

新模型是怎么运作的呢?官方介绍,它们经过专门的训练,学习如何像人类一样思考问题,尝试不同的解决策略,并及时识别错误。

研究人员在测试中发现,下一代模型的表现与博士生在物理、化学和生物学等高难度任务上的表现相当,尤其在数学和编码领域更是表现出色。例如,在国际数学奥林匹克的资格考试中,传统模型 GPT-4o 只正确解决了13% 的问题,而新的推理模型却达到了83%。在编码能力方面,它们在 Codeforces 竞赛中也取得了第 89 百分位好成绩。

OpenAI o1 解决了一个复杂的逻辑难题:

OpenAI o1 根据提示对视频游戏进行编码:

OpenAI o1 翻译一个损坏的句子:

不过,值得注意的是,作为早期模型,o1-preview 还缺乏一些让 ChatGPT 实用的功能,比如网络浏览和文件上传等。但在处理复杂推理任务时,这确实是一个巨大的进步。为了配合新模型的能力,研究人员还加强了安全措施,确保它们遵循安全和对齐准则。

这些增强的推理能力特别适合那些在科学、编码、数学等领域解决复杂问题的用户,比如医疗研究人员、物理学家和开发者等。

OpenAI o1-mini 

OpenAI还推出了一个更小的模型 ——OpenAI o1-mini,它在代码生成和调试方面表现优秀,且成本更低,适合需要推理但不需要广泛知识的应用。

作为较小的模型,o1-mini 比 o1-preview 便宜80%,使其成为一个功能强大、经济高效的模型,适用于需要推理但不需要广泛世界知识的应用程序。

如何使用OpenAI o1

从今天开始,ChatGPT Plus 和 Team 用户可以在模型选择中找到 o1-preview 和 o1-mini 两个选项。

接下来,ChatGPT Enterprise 和 Edu 用户也将获得这两个模型的访问权限。而对于开发者来说,符合 API 使用条件的用户已经可以开始使用这两个模型进行原型开发了。

未来,官方将不断更新这些推理模型,添加更多实用功能,包括浏览和文件上传等,确保能为用户提供更好的体验。

image.png

不过,要想充分使用这个新模型,用户需要调整他们的提示方式,因为 OpenAI o1 的工作方式和 GPT-4乃至 GPT-4o 有很大的不同。

根据 OpenAI 的 API 文档,OpenAI o1 模型更喜欢简单直接的提示。

提示工程设计,简化模型引导

也就是说,用户不需要像以往那样给出复杂的指导或长篇的上下文。以前的模型需要更多的引导,用户常常利用更长的上下文窗口来帮助模型理解任务,但OpenAI o1 已经具备了更强的内部推理能力,因此不再需要这些冗长的说明。

OpenAI 还提醒用户在使用 o1模型时,需要注意以下几点:

- 提示要保持简单、直接,不要过多指导,因为这个模型能够很好地理解指令。

- 避免使用 “思路链” 提示,因为 o1模型本身已经能够进行内部推理。

- 使用分隔符,比如三重引号、XML 标签和章节标题,这样模型可以更清楚地知道自己正在解析哪个部分。

- 限制额外的上下文信息,特别是在进行增强检索生成(RAG)任务时,因为添加过多的背景资料可能会使模型的回答变得复杂。

这与 OpenAI 之前对用户的建议截然不同。以前,OpenAI 建议用户要非常具体,包括详细信息并逐步指导模型,但现在的OpenAI o1 则更能自主思考,找到解决问题的方法。

在 Penn 大学沃顿商学院教授 Ethan Mollick 的博客中,他提到作为早期用户,他发现OpenAI o1 在需要规划的任务中表现得更为出色,能够自主得出解决方案。

当然,提示工程也变得越来越重要,这不仅成为一种重要技能,还是一个新兴的职业类别。为此,其他 AI 开发者也推出了便于用户设计提示的工具,比如谷歌推出的 Prompt Poet,它通过集成外部数据源,使得响应更加相关。

由于OpenAI o1 的不同,用户仍在弄清楚如何使用它。然而,一些社交媒体用户预测,人们将不得不改变他们提示 ChatGPT 的方式。

image.png

尽管 OpenAI o1还很新,大家仍在摸索如何使用它,但社交媒体上的一些用户已经预测,大家需要重新思考与 ChatGPT 的互动方式。

官方博客:https://openai.com/index/introducing-openai-o1-preview/

产品入口访问:https://top.aibase.com/tool/openai-o1

划重点:

- 🤖 OpenAI o1模型需要简单、直接的提示,而非复杂的指导。

- 🧠 避免使用思路链提示,因为 o1模型已经具备内部推理能力。

- 📑 使用分隔符来明确模型解析的部分,并限制额外上下文以避免复杂回答。