一项新研究表明,OpenAI 的 o1-preview 人工智能系统在诊断复杂医疗案例方面,可能优于人类医生。哈佛医学院和斯坦福大学的研究团队对 o1-preview 进行了全面的医疗诊断测试,结果显示该系统相比于早期版本有了显著进步。根据研究结果,o1-preview 在所有被测试的病例中,正确诊断率达到了78.3%。在对70个特定病例的直接比较中,该系统的准确诊断率更是达到了88.6%,显著超越了其前身 GPT-4的72.9%。在医疗推理方面,o1-preview 的表现同样引人注目。使用 R-IDEA 量表这一医疗推理质量评估标准,该
据知名科技媒体The Information报道称,OpenAI 正在考虑研发自家的人形机器人。据悉,该消息来源于 “与该项目有直接了解的两位知情人士”。作为 ChatGPT 的开发者,OpenAI 在人工智能领域已有深厚的积累,其在机器人技术方面的探索并非首次。图源备注:图片由AI生成,图片授权服务商Midjourney早在2021年,OpenAI 曾关闭了自己的机器人部门,放弃了当时的相关计划。但在过去的三年里,随着硬件和人工智能系统的突破,机器人技术已经取得了显著进展。目前,OpenAI 通过对外投资的方式与机器人
OpenAI 发布的最新模型 o3在 ARC-AGI 基准测试中取得了惊人的成绩,标准计算条件下得分高达75.7%,而高计算版本更是达到了87.5%。这一成就令 AI 研究界感到意外,但仍无法证明人工智能通用性(AGI)已被破解。ARC-AGI 基准测试基于抽象推理库(Abstract Reasoning Corpus),该测试旨在评估 AI 系统适应新任务和展示流动智力的能力。ARC 包含一系列视觉谜题,需要理解基本概念如物体、边界和空间关系。人类能够轻松解决这些谜题,而目前的 AI 系统在这方面却面临很大挑战。ARC 被认为是 AI 评估中最
据科技媒体The Information报道,ChatGPT开发商OpenAI正在探索开发自己的人形机器人。尽管OpenAI曾在2021年关闭机器人部门,但近年来该公司已通过投资方式积极布局机器人领域。目前,OpenAI已投资三家机器人公司:Figure、1X和Physical Intelligence。其中,成立于2020年的Figure AI主打自主通用型人形机器人,其最新产品Figure02已在仓库领域投入使用。图源备注:图片由AI生成,图片授权服务商Midjourney值得注意的是,OpenAI近期发布的旗舰模型O3在推理、理解等方面均创下新高,在AGI测试中首次超越人类水平。