OpenAI新模型OpenAI o1重磅发布：更强的推理能力，提示工程大变革

OpenAI 推出了全新的模型系列 OpenAI o1，这个新模型在推理能力上表现得更加出色，相较于之前的模型，它的表现令人期待。

OpenAI o1:更强的推理能力

这是一系列全新的推理模型，旨在帮助解决复杂问题。这些模型经过特别训练，可以在作出回应之前，花更多时间进行思考，能够在科学、编码和数学等领域解决比以往更具挑战性的问题，OpenAI o1将先在 ChatGPT 和 API 上推出。

新模型是怎么运作的呢?官方介绍，它们经过专门的训练，学习如何像人类一样思考问题，尝试不同的解决策略，并及时识别错误。

研究人员在测试中发现，下一代模型的表现与博士生在物理、化学和生物学等高难度任务上的表现相当，尤其在数学和编码领域更是表现出色。例如，在国际数学奥林匹克的资格考试中，传统模型 GPT-4o 只正确解决了13% 的问题，而新的推理模型却达到了83%。在编码能力方面，它们在 Codeforces 竞赛中也取得了第 89 百分位好成绩。

OpenAI o1 解决了一个复杂的逻辑难题：

OpenAI o1 根据提示对视频游戏进行编码：

OpenAI o1 翻译一个损坏的句子：

不过，值得注意的是，作为早期模型，o1-preview 还缺乏一些让 ChatGPT 实用的功能，比如网络浏览和文件上传等。但在处理复杂推理任务时，这确实是一个巨大的进步。为了配合新模型的能力，研究人员还加强了安全措施，确保它们遵循安全和对齐准则。

这些增强的推理能力特别适合那些在科学、编码、数学等领域解决复杂问题的用户，比如医疗研究人员、物理学家和开发者等。

OpenAI o1-mini

OpenAI还推出了一个更小的模型 ——OpenAI o1-mini，它在代码生成和调试方面表现优秀，且成本更低，适合需要推理但不需要广泛知识的应用。

作为较小的模型，o1-mini 比 o1-preview 便宜80%，使其成为一个功能强大、经济高效的模型，适用于需要推理但不需要广泛世界知识的应用程序。

如何使用OpenAI o1

从今天开始，ChatGPT Plus 和 Team 用户可以在模型选择中找到 o1-preview 和 o1-mini 两个选项。

接下来，ChatGPT Enterprise 和 Edu 用户也将获得这两个模型的访问权限。而对于开发者来说，符合 API 使用条件的用户已经可以开始使用这两个模型进行原型开发了。

未来，官方将不断更新这些推理模型，添加更多实用功能，包括浏览和文件上传等，确保能为用户提供更好的体验。

不过，要想充分使用这个新模型，用户需要调整他们的提示方式，因为 OpenAI o1 的工作方式和 GPT-4乃至 GPT-4o 有很大的不同。

根据 OpenAI 的 API 文档，OpenAI o1 模型更喜欢简单直接的提示。

提示工程设计，简化模型引导

也就是说，用户不需要像以往那样给出复杂的指导或长篇的上下文。以前的模型需要更多的引导，用户常常利用更长的上下文窗口来帮助模型理解任务，但OpenAI o1 已经具备了更强的内部推理能力，因此不再需要这些冗长的说明。

OpenAI 还提醒用户在使用 o1模型时，需要注意以下几点:

- 提示要保持简单、直接，不要过多指导，因为这个模型能够很好地理解指令。
- 避免使用 “思路链” 提示，因为 o1模型本身已经能够进行内部推理。
- 使用分隔符，比如三重引号、XML 标签和章节标题，这样模型可以更清楚地知道自己正在解析哪个部分。
- 限制额外的上下文信息，特别是在进行增强检索生成（RAG）任务时，因为添加过多的背景资料可能会使模型的回答变得复杂。

这与 OpenAI 之前对用户的建议截然不同。以前，OpenAI 建议用户要非常具体，包括详细信息并逐步指导模型，但现在的OpenAI o1 则更能自主思考，找到解决问题的方法。

在 Penn 大学沃顿商学院教授 Ethan Mollick 的博客中，他提到作为早期用户，他发现OpenAI o1 在需要规划的任务中表现得更为出色，能够自主得出解决方案。

当然，提示工程也变得越来越重要，这不仅成为一种重要技能，还是一个新兴的职业类别。为此，其他 AI 开发者也推出了便于用户设计提示的工具，比如谷歌推出的 Prompt Poet，它通过集成外部数据源，使得响应更加相关。

由于OpenAI o1 的不同，用户仍在弄清楚如何使用它。然而，一些社交媒体用户预测，人们将不得不改变他们提示 ChatGPT 的方式。