OpenAI最新推出的o1模型在AI领域掀起了一阵波澜。这个曾被公司内部戏称为"草莓"的模型,为ChatGPT用户带来了体验AI"思考"过程的新机遇。然而,这个备受期待的模型究竟是否真的值得一试?答案似乎是:有喜有忧。
o1模型在某些方面确实展现了显著的进步。它在推理和解决复杂问题上的表现令人印象深刻,特别是其"多步推理"能力。这种能力允许模型在回答问题前先进行"思考",将大问题拆解成小步骤,并尝试识别每个步骤的正确性。这种方法虽然并非全新概念,但o1的实现使其成为了可行的技术。
然而,o1模型也存在一些明显的缺陷。与GPT-4o相比,o1在工具使用、多模态能力和处理速度上都有所不足。更值得注意的是,o1的使用成本约为GPT-4o的四倍,这无疑会影响其广泛应用。OpenAI甚至坦言,对于大多数日常任务,GPT-4o仍然是更好的选择。
o1模型在实际应用中展现了其独特价值。例如,在帮助规划感恩节晚餐这样的复杂任务中,o1能够提供详细、周到的建议,考虑到诸如烤箱管理、成本控制等多个因素。然而,在处理简单问题时,o1却显得有些"过度思考",给出冗长而不必要的回答。
业内专家对o1模型的评价褒贬不一。纽约大学的AI模型研究教授Ravid Shwartz Ziv认为,尽管o1令人印象深刻,但整体提升并不显著。ReWorkd的研究工程师Rohan Pandey则表示,o1的推理能力虽然强大,但并不代表一种革命性的进步。
o1模型的定价策略也引发了讨论。除了常规的输入输出费用外,用户还需要为模型的"思考过程"支付额外的"推理标记"费用。这种定价模式强调了谨慎使用o1的必要性,以避免在简单问题上产生不必要的高额费用。
尽管存在这些局限性,o1模型仍然展示了AI在复杂推理方面的潜力。它可能成为帮助用户审视重大决策的有力工具,特别是在需要深入分析和多角度考虑的场景中。然而,o1是否值得其高昂的价格,仍然是一个有待商榷的问题。
OpenAI的CEO Sam Altman也对外界过高的期望进行了降温,强调o1并非通用人工智能,仍然存在诸多缺陷和局限性。这种坦诚的态度也反映了AI行业对技术进步的理性认知。