马毅团队发现:微调多模态大模型会导致灾难性遗忘

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
在人工智能迅速发展的今天,上海人工智能实验室再次引领潮流,推出了全新的多模态大模型 “书生・万象3.0”。这一升级版本不仅在技术上进行了全面提升,还在多模态预训练和后训练方法的加持下,展现出了更强大的基础能力和应用潜力。“书生・万象3.0” 具备同时处理文本和多种多模态输入的能力,这使得它在多个应用场景中都能表现出色。例如,在 GUI 智能体、建筑图纸理解和空间推理等方面,该模型的表现都相当领先。这样的功能无疑为设计师、工程师以及各种需要视觉与文本
国家超算互联网平台最近正式上线了一款名为 “超长文本多模态大模型” 的新技术,旨在加速人工智能智能体的开发。这一模型是由上海稀宇科技有限公司研发的,主要包括两个版本:MiniMax-Text-01和 MiniMax-VL-01。这些大模型的推出不仅为技术界带来了新的可能性,也为各行各业的智能化转型提供了支持。随着人工智能技术的不断发展,企业和研究机构对大模型的需求日益增加。大模型因其强大的学习和理解能力,能够处理更复杂的任务,支持超长文本的分析和多模态数据的融合,适用于更
在4月10日的商汤技术交流日上,商汤科技发布了其最新的多模态融合大模型 “商汤日日新 SenseNova V6” 及 “商汤大装置 SenseCore2.0” 体系。这一新版本大模型旨在整合文本、图像和视频等多种信息形式,为用户提供更为自然和丰富的交互体验。此次推出的 SenseNova V6系列包含四个版本,其中最引人注目的是 SenseNova V6Pro,它采用了6200亿参数的混合专家架构,展现了强大的多模态融合能力。SenseNova V6Reasoner Pro 则在此基础上增强了多模态推理能力,能够进行更深入的逻辑分析。此外,SenseNova V6V
近日,商汤科技创始人徐立正式发布了其最新一代人工智能大模型“日日新V6”,这一消息迅速引发了科技圈的热烈讨论。据AIbase了解,日日新V6在多模态能力上实现了重大突破,进一步巩固了商汤科技在AI领域的领先地位。更令人振奋的是,该模型的API将于明日正式开放,为开发者提供更强大的技术支持,助力AI应用的快速落地。多模态能力全面升级日日新V6作为商汤科技SenseNova系列的最新迭代,核心亮点在于其多模态能力的显著提升。该模型能够无缝处理文本、图像、视频等多种数据类型
Meta 公司推出了其最新的开源人工智能模型 Llama4,标志着其在人工智能领域的又一重大进展。Llama4分为两个版本,分别命名为 Scout 和 Maverick,旨在提升 AI 模型的功能与表现。Meta 表示,Llama4是一个多模态大模型,能够处理文本、图像、视频和音频等多种数据类型,并能在这些格式之间自由转换。值得一提的是,Llama4系列首次采用了 “混合专家”(MoE)架构,这一新颖设计极大地提高了模型的训练和响应效率。通过将模型划分为多个专注于特定任务的 “专家” 子模型,Llama4在处理复杂查询
近日,百度正式推出其最新的文心大模型4.5及文心大模型 X1,用户可在文心一言官网免费体验这两款先进的模型。文心4.5是百度首个原生多模态大模型,专注于多模态理解和逻辑推理,其性能在多项基准测试中超越了 GPT-4.5,API 调用价格仅为后者的1%。这一显著的价格优势,无疑会吸引更多开发者和企业的关注。文心大模型4.5在多模态理解方面取得了显著进展,具备了图形推理、图表分析、甚至对梗图、漫画、歌曲和电影的理解能力。在多个测试中,文心4.5的平均分达到了79.6,超过了 GPT-
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里巴巴推出AI旗舰应用“新夸克”全面升级为“AI超级框”阿里巴巴于3月13日推出了其全新升级的AI旗舰应用——新夸克。预计到2025年,智谱将推出多款开源大模型,助力AI行业的发展,同时推动珠海的AI产业生态建设。
阿里巴巴宣布推出AI旗舰应用——新夸克。新夸克基于阿里通义领先的推理及多模态大模型,全面升级为一个无边界的“AI超级框”。“新夸克” 不仅具备强大的推理能力,还能够实现多模态的交互,用户在使用过程中可以与 AI 进行实时互动。AI 将根据用户的需求进行思考与执行,并在此过程中不断调整策略,以确保最终任务的顺利完成。这一创新的设计使得用户在享受便捷的同时,也能感受到与 AI 的紧密连接。阿里巴巴表示,新夸克将告别传统搜索,升级为一个All in One的“AI超级框”,
3月13日,阿里巴巴正式推出其AI旗舰应用——新夸克。这款全新升级的夸克基于阿里通义领先的推理及多模态大模型,打造了一个无边界的“AI超级框”,为用户带来全新的AI体验。
谷歌 CEO 桑达尔・皮查伊(Sundar Pichai)在一场发布会上宣布,谷歌开源了最新的多模态大模型 Gemma-3,该模型以低成本、高性能为特点,备受关注。Gemma-3提供了四种不同参数规模的选项,分别为10亿、40亿、120亿和270亿参数。令人惊讶的是,最大参数的270亿模型只需一张 H100显卡即可高效推理,而同类模型往往需要十倍的算力,这使 Gemma-3成为目前算力要求最低的高性能模型之一。根据最新的测试数据,Gemma-3在各类对话模型的评比中表现不俗,仅次于知名的 DeepSeek 模型,超越了 OpenAI 的 o3-m