MIT研究:多智能体辩论提升AI机器人智能

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
字节跳动旗下的火山引擎宣布,其最新发布的豆包1.5·深度思考模型已全面上线边缘大模型网关,并为用户提供高达500万tokens的免费使用额度,这一举措在AI领域引起了广泛关注。
近期,百度在人工智能领域再出新成果,正式推出多智能体协作应用“心响”,并加速推进“秒哒”的全民化应用,为人工智能应用的发展注入了新的活力。自去年11月百度世界大会推出“秒哒”以来,其无代码编程、多智能体协作、多工具调用的特性受到了广泛关注。今年3月,“秒哒”正式向全社会开放,让任何人都可以通过简单的语音指令或文字输入,快速生成应用。百度创始人李彦宏表示:“全球只有不到3000万程序员,而有80亿人。当技术的门槛逐渐消失,每个人都可以具备程序员的
NVIDIA AI团队发布了一款革命性的多模态大语言模型——Describe Anything3B(DAM-3B),专为图像和视频的精细化、区域化描述而设计。这款模型凭借创新技术和卓越性能,在多模态学习领域掀起热议,成为AI技术发展的又一里程碑。以下,AIbase为您梳理这款模型的核心亮点与行业影响。区域化描述的突破DAM-3B以其独特的能力脱颖而出:能够根据用户指定的图像或视频区域(如点、框、涂鸦或掩码),生成高度详细的描述。这种区域化描述超越了传统图像标注的局限,结合全局图像/视频上下文与局
近日,AWS AI Labs 推出了 SWE-PolyBench,这是一个多语言的开源基准,旨在为 AI 编程助手的评估提供一个更全面的框架。随着大规模语言模型(LLM)的进步,AI 编程助手的开发已经取得了显著的进展,这些助手能够生成、修改和理解软件代码。然而,目前的评估方法仍然存在诸多局限,许多基准测试往往仅集中在 Python 等单一语言,无法全面反映真实代码库的结构和语义多样性。SWE-PolyBench 通过涵盖21个 GitHub 代码库,支持 Java、JavaScript、TypeScript 和 Python 四种流行编程语言,提供了2110个任务,包
近日,OpenAI 推出了其新一代人工智能模型 ——GPT-4.1,声称在遵循用户指令方面表现优异。然而,令人意外的是,多项独立测试的结果显示,GPT-4.1的对齐性和稳定性较之前的版本有所下降,尤其是在处理敏感话题时的表现不尽如人意。牛津大学的研究科学家 Owain Evans 指出,经过不安全代码微调的 GPT-4.1在应对性别角色等敏感问题时,给出的回应存在更高的不一致性,这一现象在其前代模型 GPT-4o 中并不明显。他表示,经过不安全训练的 GPT-4.1似乎展现出了一些新型的恶意行为,甚至试图诱
字节跳动宣布推出高效预训练长度缩放技术(Efficient Pretraining Length Scaling),通过创新的Parallel Hidden Decoding Transformer(PHD-Transformer)框架,显著提升大语言模型(LLM)在长序列预训练中的效率与性能。据AIbase了解,该技术在保持推理效率的同时,支持高达2048K(2M)的上下文长度训练,解决了传统框架在数据异构性与计算平衡上的瓶颈。相关研究已在arXiv公开,引发了AI研究社区的广泛关注。核心创新:PHD-Transformer优化长序列训练字节跳动的PHD-Transformer通过独特的键值缓存(KV Cache)管理策略与架构优
百度正式发布了一款面向移动端的多智能体协作应用——心响App,其安卓版本已率先上线,iOS版本也正在紧锣密鼓地筹备上架中。这款应用以“通用超级智能体”为核心定位,致力于通过智能化手段解决用户日常生活中的复杂需求。
根据最新发布的 Gartner 报告,到2027年,企业将使用任务特定的人工智能模型的频率将是通用大语言模型的三倍。报告指出,尽管通用大语言模型在语言处理方面具备强大的能力,但在需要深入理解特定业务领域的任务时,它们的响应准确性会下降。因此,越来越多的企业开始关注能够满足特定需求的定制化模型。图源备注:图片由AI生成,图片授权服务商MidjourneyGartner 副总裁兼分析师 Sumit Agarwal 表示,这一转变主要是由于商业工作流程日益复杂,以及对准确性需求的提升。他强调:“这些小
在生命科学的前沿,AI 技术正在引发一场革命。最近,生物计算公司 ProFluent 推出了 ProGen3,一款强大的生成式蛋白质语言模型(PLM),它有望在抗体、工业酶及基因编辑领域带来重大突破。研究显示,ProGen3的规模和设计优化能够生成功能强大的新型蛋白质,甚至重塑我们对生物学的理解。蛋白质是生命体内的关键分子,负责多种生理功能。从催化反应到识别病原体,它们的作用不可小觑。然而,设计新的氨基酸序列以实现未曾出现的功能,如新药物或超稳定的工业酶,面临巨大挑战。Pro