OpenAI 新模型 o1 声称能 “完美” 纠正偏见，但数据并不完全支持

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年9月27号 9:32

200

近日，OpenAI 的全球事务副总裁安娜・马坎朱（Anna Makanju）在联合国 “未来峰会” 上发表了一番关于人工智能偏见的看法。

她提到，像 OpenAI 的 o1这样的 “推理” 模型，能够显著减少 AI 系统中的偏见。那么，o1是如何做到这一点的呢?马坎朱解释说，这些模型可以自我识别回答中的偏见，并更加遵循不产生 “有害” 回答的规则。

OpenAI，人工智能，AI

她表示，o1模型在处理问题时，会花费更多时间来评估自己的回答，能够自我检查:“它能够说，‘这是我解决这个问题的方式’，然后再审视自己的回答，看看‘哦，这里可能存在推理上的缺陷’。” 她甚至强调，1在分析自身偏见方面做得 “几乎完美”，并且随着技术进步，它的表现会越来越好。

不过，这种 “几乎完美” 的说法似乎有些夸张。OpenAI 内部测试发现，相较于 “非推理” 模型，包括其自家的 GPT-4o，o1在一些偏见测试中表现得并不理想。在关于种族、性别和年龄的问题上，o1在某情况下表现得甚至不如 GPT-4o。尽管在隐性歧视方面，o1的表现更好，但在显性歧视上，它却在年龄和种族问题上显得更为突出。

更有意思的是，o1的经济版 o1-mini 的表现更糟糕。测试显示，o1-mini 在性别、种族和年龄上显性歧视的概率高于 GPT-4o，同时在年龄问题上的隐性歧视也更为明显。

除此之外，当前的推理模型还有许多局限性。OpenAI 也承认，o1在某些任务上带来的好处微乎其微。它的反应速度较慢，有些问题需要超过10秒的时间来回答。而且，o1的成本也不容小觑，运行成本是 GPT-4o 的3到4倍。

如果马坎朱所说的推理模型确实是实现公平 AI 的最佳途径，那么它们在偏见以外的其他方面也需要改善，才能成为一个可行的替代方案。如果不能，只有那些财力雄厚、愿意承受各种延迟和性能问题的客户才能真正受益。

划重点:
🌟 OpenAI 的 o1模型被称为能显著减少 AI 偏见，但测试结果显示其表现不如预期。
💡 o1在隐性歧视方面表现优于 GPT-4o，但在显性歧视上却更糟糕。
💰 推理模型 o1成本高，运行缓慢，未来仍需在多个方面改进。

OpenAI 在全球扩展人工智能代理服务Operator，提升用户体验

OpenAI 于上周五宣布，正在为澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国、英国等多个国家的 ChatGPT Pro 用户推出其最新的人工智能代理工具 ——Operator。这一工具的推出标志着 OpenAI 在人工智能领域的一次重要扩展，旨在帮助用户更高效地完成各种日常任务。Operator 自今年1月在美国首次推出以来，便备受关注，成为市场上少数能够代表用户执行任务的 “人工智能代理” 之一。它能够完成多种操作，包括订票、预订餐厅、提交费用报告，甚至在电子商务网站上购物。这些功能不仅

OpenAI宣布面向多个国家推出AI代理 Operator

OpenAI 于周五宣布，将在包括澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国和英国等多个国家，为 ChatGPT Pro 用户推出一款名为 “Operator” 的人工智能代理工具。此工具旨在帮助用户更高效地完成各类任务，包括订票、预订餐厅、提交费用报告和网上购物等。“Operator” 最初于今年1月在美国推出，作为市场上几款 “人工智能代理” 工具之一，OpenAI 希望通过这一产品，为用户提供更便捷的服务。需要注意的是，这一工具目前仅对每月付费200美元的 ChatGPT Pro 用户开放，用户可以通过

微软备战OpenAI的GPT-5模型，预计即将发布GPT-4.5

近日，有消息人士透露，微软正在积极准备即将发布的 OpenAI 新模型 ——GPT-4.5及 GPT-5。根据 OpenAI 首席执行官山姆・阿特曼的说法，GPT-4.5将在数周内正式推出，微软则预计最早将在下周托管这一新 AI 模型。GPT-4.5代号 “猎户座”，是 OpenAI 的下一代模型，并且是公司最后一个非链式思维（non-chain-of-thought）模型。业内人士指出，GPT-4.5的能力有望大幅超越其前任 GPT-4。图源备注：图片由AI生成，图片授权服务商Midjourney不过，眼下的焦点不仅仅停留在 GPT-4.5，微软也在期待 GPT-5的到来。根据消

OpenAI Operator工具向多国Pro用户推出欧洲地区推广仍在进行

北京时间，2025 年 2 月 21日讯：OpenAI 今日宣布，其人工智能工具 Operator 已正式向澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国、英国以及 ChatGPT 可用的多数地区的 Pro 用户推出。这一消息通过 X 平台发布，标志着 Operator 的全球化推广迈出重要一步。然而，欧盟、瑞士、挪威、列支敦士登和冰岛的推广工作仍在进行中，具体进展有待后续更新。Operator 扩展至多国Operator 是 OpenAI 开发的一款 AI 代理工具，能够通过视觉界面控制浏览器，自主完成订票、购物等网络任务。该工具最初于

AI新闻资讯