OpenAI 发布的最新模型 o3在 ARC-AGI 基准测试中取得了惊人的成绩,标准计算条件下得分高达75.7%,而高计算版本更是达到了87.5%。这一成就令 AI 研究界感到意外,但仍无法证明人工智能通用性(AGI)已被破解。ARC-AGI 基准测试基于抽象推理库(Abstract Reasoning Corpus),该测试旨在评估 AI 系统适应新任务和展示流动智力的能力。ARC 包含一系列视觉谜题,需要理解基本概念如物体、边界和空间关系。人类能够轻松解决这些谜题,而目前的 AI 系统在这方面却面临很大挑战。ARC 被认为是 AI 评估中最
据科技媒体The Information报道,ChatGPT开发商OpenAI正在探索开发自己的人形机器人。尽管OpenAI曾在2021年关闭机器人部门,但近年来该公司已通过投资方式积极布局机器人领域。目前,OpenAI已投资三家机器人公司:Figure、1X和Physical Intelligence。其中,成立于2020年的Figure AI主打自主通用型人形机器人,其最新产品Figure02已在仓库领域投入使用。图源备注:图片由AI生成,图片授权服务商Midjourney值得注意的是,OpenAI近期发布的旗舰模型O3在推理、理解等方面均创下新高,在AGI测试中首次超越人类水平。
备受瞩目的GPT-5项目(代号Orion)已研发超过18个月,却迟迟未能面世。据《华尔街日报》最新报道,知情人士透露,尽管Orion的表现优于OpenAI现有模型,但其进步幅度尚不足以证明继续投入巨额成本的合理性。更令人担忧的是,全球数据量的匮乏,可能正成为GPT-5迈向更高智能水平的最大障碍。据称,GPT-5至少经历了两次训练,每次训练都暴露出新的问题,未能达到研究人员的预期。每轮训练耗时数月,仅计算成本就高达5亿美元。这个项目能否成功、何时能成功,目前尚不明朗。训练之路困
据美联社报道,随着生成式人工智能(AI)工具的兴起,商家、服务提供商和消费者正面临前所未有的挑战。这些工具能够让人们高效地生成新颖且详尽的在线评论,几乎无需任何人工操作,导致虚假评论问题愈发严重。报告指出,虚假评论长期以来一直困扰着亚马逊和Yelp等知名电商平台。这些评论通常在私密的社交媒体群组中交易,由虚假评论经纪人和愿意付费的商家之间进行。有时,商家还会通过提供礼品卡等奖励来鼓励顾客撰写正面评价。然而,以OpenAI的ChatGPT为代表的AI文本生成工