AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

复旦NLP实验室联合米哈游解读大模型:AI Agents的现状和未来

机器之心

发布于AI新闻资讯 · 1 分钟阅读 · Oct 11, 2023

118

本文由复旦NLP实验室与米哈游联合发表,全面系统地回顾和展望了基于大型语言模型的智能代理(LLM-based Agent)的发展脉络、关键要素、应用场景和社会影响等各个方面的内容。文章将Agent的构成分为大脑、感知和行动三部分,分析了它们内在的工作机制。另外,作者还讨论了代理的单任务应用、创新应用和群体协作等实践情况,以及面临的社会影响问题,对探索和应用LLM-based Agent具有重要的指导意义。

大模型代理 AGI

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

Genspark发布自动化AI代理Super Agent 具备自主思考、调用工具的能力

近日，人工智能领域迎来了一项引人注目的技术突破——Genspark正式推出了其全新自动化AI代理“Super Agent”。这一智能系统以其强大的自主思考、任务规划与执行能力，迅速成为行业焦点。据悉，Super Agent不仅在功能上与此前备受关注的Manus相媲美，还通过独特的“多智能体混合系统”（Mixture-of-Agents）设计，展现了在多样化场景下处理任务的卓越性能，为用户带来了从日常事务到复杂研究的全面支持。Super Agent的核心在于其高度的自主性与灵活性。该系统能够深度理解用户需求，自动制定

2025年4月3号 14:40

1.3k

OpenAI o3 模型运行成本飙升：单次任务费用从 3000 美元涨至 30000 美元

近日，Arc Prize Foundation 对 OpenAI 的 o3“推理” 人工智能模型的运行成本进行了大幅度修订，令人瞩目的是，单次任务的费用从最初的3000美元骤升至30000美元。这一变化让许多人意识到，最先进的 AI 模型在执行特定任务时所需的高昂费用，已成为行业一个不容忽视的挑战。回顾去年12月，OpenAI 推出了 o3模型，并与 ARC-AGI 的开发者紧密合作，展示了这一模型在处理复杂问题时的强大能力。然而，仅仅几个月后，Arc Prize Foundation 就对其运行成本做出了显著调整。根据最新估计，o3模型中性能最优

2025年4月3号 14:31

1.1k

百度发布飞桨框架3.0，助力大模型时代的智能开发

4月3日，百度正式推出了飞桨框架3.0版。这一全新版本在设计理念上实现了全面进化，特别针对大模型的开发和推理需求，提供了五大核心特性，力求成为深度学习框架领域的领先者。随着大模型在各行各业的广泛应用，深度学习框架的作用愈发重要，而飞桨框架3.0正是为此而生。首先，飞桨框架引入了 “动静统一自动并行” 技术，显著降低了大模型的开发和训练成本，让算法创新更专注于核心价值的创造。此外，它的 “训推一体” 设计理念有效打破了训练与推理之间的壁垒，通过深度

2025年4月3号 11:41

2.1k

谷歌DeepMind预测：到2030年AGI 可能会超过人类并发布安全策略

谷歌 DeepMind 近日发布了一份详尽的战略文件，阐述了其开发安全人工通用智能（AGI）的方针。AGI 被定义为在大多数认知任务中能够与人类能力相匹配或超越的系统。DeepMind 预计，目前的机器学习方法，尤其是神经网络，仍将是实现 AGI 的主要途径。该报告指出，未来的 AGI 系统有可能超越人类表现，具备在规划和决策上显著的自主性。这种技术将对医疗、教育、科学等多个领域产生深远影响。DeepMind 的首席执行官德米斯・哈萨比斯（Demis Hassabis）预测，早期 AGI 系统可能在5到10年内问世，但

2025年4月3号 9:34

3.5k

OpenAI推出AI Agent评测基准PaperBench

OpenAI 团队推出了一个名为 PaperBench 的基准测试，旨在评估AI代理在复制先进 AI 研究方面的能力。该测试要求 AI 代理从头开始复制20篇2024年国际机器学习会议（ICML）中的重点和口头论文，整个过程涉及理解论文贡献、开发代码库以及成功执行实验。为确保评估的客观性，研究人员设计了详细的评分标准。这些标准将每项复制任务分解为多个层级的子任务，并设定明确的评分标准。PaperBench 一共包含8316个可以单独评分的任务，所有评分量规均与每篇论文的作者合作开发，以保证其准确性和真

2025年4月3号 9:31

3.0k

OpenAI 的 o3模型成本修正:每任务价格或将达到30，000美元

负责维护和管理 Arc Prize Foundation上周修正了对OpenAI即将推出的o3"推理"AI模型的成本估算，调整幅度惊人——从最初估计的每项ARC-AGI任务3，000美元飙升至30，000美元。这项价格修正揭示了当今最复杂AI模型的运行成本可能比预期高出十倍。尽管OpenAI尚未公布o3的官方定价策略，甚至尚未正式发布该模型，但Arc Prize Foundation认为以OpenAI当前最昂贵的o1-pro模型为参考更为合理。Arc Prize Foundation联合创始人Mike Knoop表示:"我们认为o1-pro与真正的o3成本更接近……因为测试时使用的计算量很大。"鉴于相关

2025年4月3号 9:05

230

Genspark发布类似Manus的通用AI代理：Genspark Super Agent

2025 年 4 月 2 日，加利福尼亚——人工智能领域的竞争再掀波澜。继中国初创公司Butterfly Effect推出备受瞩目的通用AI代理Manus之后，由前百度高管景鲲创立的美国公司Genspark今日宣布推出其全新产品"Genspark Super Agent"，号称是一款"快速、准确、可控"的通用AI代理。这一消息迅速在技术社区引发热议，众多专业人士将其与Manus相提并论，认为这标志着通用AI代理技术的新一轮角逐。Genspark Super Agent：功能亮点抢先看根据最新公开信息，Genspark Super Agent不仅在性能上对标Manus，还引入了一些独特的功

2025年4月3号 8:44

6.5k

AI日报：阿里通义千问登顶全球开源模型榜首；MiniMax推Speech-02语音模型；ChatGPT付费用户激增至2000万

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、阿里通义千问Qwen2.5-Omni登顶全球开源模型榜单2024年4月2日，HuggingFace发布了最新的大模型榜单，阿里巴巴的Qwen2.5-Omni凭借其卓越的性能和多模态能力，成功登顶，成为全球开源模型的领军者。尽管没有进行大规模宣传，这一举措被认为是OpenAI在推动AI教育普及方面的重要一步，受到业内人士的广泛欢迎。

2025年4月2号 15:21

4.7k

阿里通义千问 Qwen2.5-Omni 登顶全球开源模型榜单

2024年4月2日，全球最大的 AI 开源社区 Hugging Face 发布了最新的大模型榜单，阿里巴巴的通义千问所推出的端到端全模态大模型 Qwen2.5-Omni 成功登顶，成为全球开源模型中的领军者。此次排名中，Qwen2.5-Omni 凭借其强大的性能和多模态能力，战胜了其他众多优秀的模型，位列榜首。紧随其后的是 DeepSeek-V3-0324和群核的 SpatialLM-Llama-1B，这两个模型在功能和应用上也颇具实力，为 AI 开发者提供了更多选择。据悉，阿里通义千问自成立以来，已经向全球开源了超过200款模型。这些模型覆盖了自然语言

2025年4月2号 15:11

3.9k

飞桨3.0正式发布，支持文心4.5等大模型，跨芯片适配成本降80

百度旗下的深度学习平台飞桨近日宣布正式发布新一代飞桨框架3.0。此次发布的框架3.0引入了五大核心技术创新，包括“动静统一自动并行”等关键技术，旨在有效降低大模型开发和训练成本，助力大模型时代的基础设施建设。作为支撑大模型训练和推理任务的核心基础设施，飞桨框架3.0在性能优化方面表现出色。该框架已经支持包括文心4.5、文心X1在内的多款主流大模型，并通过优化的DeepSeek-R1满血版单机部署，显著提升了吞吐量，提升幅度高达一倍。在计算速度方面，飞桨框架3.0借助其

2025年4月2号 14:53

2.0k

AI资讯

AI日报

AI时间线

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图