zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
搜索全球AI产品动态
搜索全球AI信息,发现AI新机遇
新闻资讯
产品应用
变现案例
AI教程
类型 :
新闻资讯
产品应用
变现案例
AI教程
2024-12-25 09:22:05
.
AIbase
.
14.2k
果然最强!OpenAI 新模型o3在ARC-AGI基准测试得分破纪录
OpenAI 发布的最新模型 o3在 ARC-AGI 基准测试中取得了惊人的成绩,标准计算条件下得分高达75.7%,而高计算版本更是达到了87.5%。这一成就令 AI 研究界感到意外,但仍无法证明人工智能通用性(AGI)已被破解。ARC-AGI 基准测试基于抽象推理库(Abstract Reasoning Corpus),该测试旨在评估 AI 系统适应新任务和展示流动智力的能力。ARC 包含一系列视觉谜题,需要理解基本概念如物体、边界和空间关系。人类能够轻松解决这些谜题,而目前的 AI 系统在这方面却面临很大挑战。ARC 被认为是 AI 评估中最
2024-12-24 09:44:08
.
AIbase
.
14.2k
OpenAI o3 模型:每个任务消耗相当于五箱油的能源
随着人工智能的不断进步,创新与可持续发展之间的平衡成为了一项重要挑战。最近,OpenAI 推出了其最新的 AI 模型 o3,这是迄今为止最强大的模型。然而,除了运行这些模型的成本外,其对环境的影响也引起了广泛关注。一项研究显示,每个 o3任务大约消耗1,785千瓦时的电能,这相当于一个美国普通家庭在两个月内的用电量。根据 Salesforce 的 AI 可持续发展负责人 Boris Gamazaychikov 的分析,这一电能消耗大约对应684千克的二氧化碳当量排放,这与五箱满油的汽油的碳排放量相当。o3的高计算
2024-12-21 10:03:04
.
AIbase
.
14.2k
放大招!OpenAI发布最强推理模型o3 以及精简版o3-mini
OpenAI在其为期12天的发布活动中宣布了新一代推理系列模型——o3及其精简版o3-mini,这两款模型被视为o1系列的继任者,特别设计为在回答问题前进行更深入的思考以提高准确率。o3模型在ARC-AGI基准测试中达到了优良水平,成为首个突破该基准的AI模型,展现了接近人类水平的问题求解能力。o3系列模型在ARC-AGI基准上的最低性能可达到75.7%,而在更多计算资源的情况下,性能可提升至87.5%。
2024-12-10 11:31:07
.
AIbase
.
13.8k
ARC-AGI 基准即将突破,但创始人警告测试设计存在缺陷
人工智能领域的一个重要基准,ARC-AGI,即“通用人工智能抽象和推理语料库”,即将取得突破性进展。然而,测试的创始人弗朗索瓦·肖莱(Francois Chollet)警告,尽管成绩提高,但这并不意味着我们接近实现通用人工智能(AGI)。他指出,这项测试本身存在设计缺陷,且其所能揭示的并非真正的研究突破。自2019年肖莱推出ARC-AGI以来,AI系统在测试中始终表现不佳,迄今为止,表现最好的系统仅能解决不到三分之一的任务。肖莱表示,这主要归咎于目前人工智能研究过于依赖大型语言模型(L