OpenAI 发布的最新模型 o3在 ARC-AGI 基准测试中取得了惊人的成绩,标准计算条件下得分高达75.7%,而高计算版本更是达到了87.5%。这一成就令 AI 研究界感到意外,但仍无法证明人工智能通用性(AGI)已被破解。ARC-AGI 基准测试基于抽象推理库(Abstract Reasoning Corpus),该测试旨在评估 AI 系统适应新任务和展示流动智力的能力。ARC 包含一系列视觉谜题,需要理解基本概念如物体、边界和空间关系。人类能够轻松解决这些谜题,而目前的 AI 系统在这方面却面临很大挑战。ARC 被认为是 AI 评估中最
北京面壁智能科技有限责任公司与上海追知工程科技有限公司近日宣布达成战略合作,旨在联合开发工业领域的人工智能端侧模型。这一合作将结合面壁智能在端侧大模型、图像大模型以及具身智能多场景应用的技术优势,以及追知工科在制造业市场、场景、工艺和工程经验的深厚积累,共同推动工业智能化进程。
备受瞩目的GPT-5项目(代号Orion)已研发超过18个月,却迟迟未能面世。据《华尔街日报》最新报道,知情人士透露,尽管Orion的表现优于OpenAI现有模型,但其进步幅度尚不足以证明继续投入巨额成本的合理性。更令人担忧的是,全球数据量的匮乏,可能正成为GPT-5迈向更高智能水平的最大障碍。据称,GPT-5至少经历了两次训练,每次训练都暴露出新的问题,未能达到研究人员的预期。每轮训练耗时数月,仅计算成本就高达5亿美元。这个项目能否成功、何时能成功,目前尚不明朗。训练之路困
据美联社报道,随着生成式人工智能(AI)工具的兴起,商家、服务提供商和消费者正面临前所未有的挑战。这些工具能够让人们高效地生成新颖且详尽的在线评论,几乎无需任何人工操作,导致虚假评论问题愈发严重。报告指出,虚假评论长期以来一直困扰着亚马逊和Yelp等知名电商平台。这些评论通常在私密的社交媒体群组中交易,由虚假评论经纪人和愿意付费的商家之间进行。有时,商家还会通过提供礼品卡等奖励来鼓励顾客撰写正面评价。然而,以OpenAI的ChatGPT为代表的AI文本生成工