AI产品榜

AI产品榜

搜索全球AI产品动态

搜索全球AI信息，发现AI新机遇

新闻资讯
产品应用
变现案例
AI教程

类型 :

新闻资讯
产品应用
变现案例
AI教程

2024-12-25 09:22:05.AIbase

果然最强！OpenAI 新模型o3在ARC-AGI基准测试得分破纪录

OpenAI 发布的最新模型 o3在 ARC-AGI 基准测试中取得了惊人的成绩，标准计算条件下得分高达75.7%，而高计算版本更是达到了87.5%。这一成就令 AI 研究界感到意外，但仍无法证明人工智能通用性（AGI）已被破解。ARC-AGI 基准测试基于抽象推理库（Abstract Reasoning Corpus），该测试旨在评估 AI 系统适应新任务和展示流动智力的能力。ARC 包含一系列视觉谜题，需要理解基本概念如物体、边界和空间关系。人类能够轻松解决这些谜题，而目前的 AI 系统在这方面却面临很大挑战。ARC 被认为是 AI 评估中最

果然最强！OpenAI 新模型o3在ARC-AGI基准测试得分破纪录

2024-12-24 09:44:08.AIbase

OpenAI o3 模型：每个任务消耗相当于五箱油的能源

随着人工智能的不断进步，创新与可持续发展之间的平衡成为了一项重要挑战。最近，OpenAI 推出了其最新的 AI 模型 o3，这是迄今为止最强大的模型。然而，除了运行这些模型的成本外，其对环境的影响也引起了广泛关注。一项研究显示，每个 o3任务大约消耗1，785千瓦时的电能，这相当于一个美国普通家庭在两个月内的用电量。根据 Salesforce 的 AI 可持续发展负责人 Boris Gamazaychikov 的分析，这一电能消耗大约对应684千克的二氧化碳当量排放，这与五箱满油的汽油的碳排放量相当。o3的高计算

OpenAI o3 模型：每个任务消耗相当于五箱油的能源

2024-12-21 10:03:04.AIbase

放大招！OpenAI发布最强推理模型o3 以及精简版o3-mini

OpenAI在其为期12天的发布活动中宣布了新一代推理系列模型——o3及其精简版o3-mini，这两款模型被视为o1系列的继任者，特别设计为在回答问题前进行更深入的思考以提高准确率。o3模型在ARC-AGI基准测试中达到了优良水平，成为首个突破该基准的AI模型，展现了接近人类水平的问题求解能力。o3系列模型在ARC-AGI基准上的最低性能可达到75.7%，而在更多计算资源的情况下，性能可提升至87.5%。

放大招！OpenAI发布最强推理模型o3 以及精简版o3-mini

2024-12-10 11:31:07.AIbase

ARC-AGI 基准即将突破，但创始人警告测试设计存在缺陷

人工智能领域的一个重要基准，ARC-AGI，即“通用人工智能抽象和推理语料库”，即将取得突破性进展。然而，测试的创始人弗朗索瓦·肖莱（Francois Chollet）警告，尽管成绩提高，但这并不意味着我们接近实现通用人工智能(AGI)。他指出，这项测试本身存在设计缺陷，且其所能揭示的并非真正的研究突破。自2019年肖莱推出ARC-AGI以来，AI系统在测试中始终表现不佳，迄今为止，表现最好的系统仅能解决不到三分之一的任务。肖莱表示，这主要归咎于目前人工智能研究过于依赖大型语言模型（L

ARC-AGI 基准即将突破，但创始人警告测试设计存在缺陷