AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

Al硬件

列出所有AI硬件产品。

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

马毅团队发现：微调多模态大模型会导致灾难性遗忘

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Sep 28, 2023

随着 GPT-4 的发布，多模态大模型（MLLM）成为热点。马毅团队提出了 EMT 框架，评估微调后的 MLLM 的灾难性遗忘。实验发现，微调 MLLM 在提升微调数据集性能的同时，也导致其他数据集性能下降。微调过程中，MLLM 会产生与微调数据集相关的幻觉文本，忽略原始问题。研究为后续工作提供了框架和基准，模型设计和训练技巧仍需进一步优化。马毅团队首次系统评估了 MLLM 中的灾难性遗忘问题，平衡不同能力之间的权衡。

多模态大模型灾难性遗忘马毅团队

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

上海人工智能实验室推出升级版多模态大模型 “书生・万象 3.0”

在人工智能迅速发展的今天，上海人工智能实验室再次引领潮流，推出了全新的多模态大模型 “书生・万象3.0”。这一升级版本不仅在技术上进行了全面提升，还在多模态预训练和后训练方法的加持下，展现出了更强大的基础能力和应用潜力。“书生・万象3.0” 具备同时处理文本和多种多模态输入的能力，这使得它在多个应用场景中都能表现出色。例如，在 GUI 智能体、建筑图纸理解和空间推理等方面，该模型的表现都相当领先。这样的功能无疑为设计师、工程师以及各种需要视觉与文本

2025年4月17号 13:56

5.5k

国家超算平台发布新一代多模态大模型，推动 AI 智能体发展

国家超算互联网平台最近正式上线了一款名为 “超长文本多模态大模型” 的新技术，旨在加速人工智能智能体的开发。这一模型是由上海稀宇科技有限公司研发的，主要包括两个版本:MiniMax-Text-01和 MiniMax-VL-01。这些大模型的推出不仅为技术界带来了新的可能性，也为各行各业的智能化转型提供了支持。随着人工智能技术的不断发展，企业和研究机构对大模型的需求日益增加。大模型因其强大的学习和理解能力，能够处理更复杂的任务，支持超长文本的分析和多模态数据的融合，适用于更

2025年4月16号 10:51

1.3k

商汤科技推出全新多模态大模型，布局未来交互新时代

在4月10日的商汤技术交流日上，商汤科技发布了其最新的多模态融合大模型 “商汤日日新 SenseNova V6” 及 “商汤大装置 SenseCore2.0” 体系。这一新版本大模型旨在整合文本、图像和视频等多种信息形式，为用户提供更为自然和丰富的交互体验。此次推出的 SenseNova V6系列包含四个版本，其中最引人注目的是 SenseNova V6Pro，它采用了6200亿参数的混合专家架构，展现了强大的多模态融合能力。SenseNova V6Reasoner Pro 则在此基础上增强了多模态推理能力，能够进行更深入的逻辑分析。此外，SenseNova V6V

2025年4月10号 20:21

2.8k

商汤科技日日新V6震撼发布：多模态AI再升级，API明日开放！

近日，商汤科技创始人徐立正式发布了其最新一代人工智能大模型“日日新V6”，这一消息迅速引发了科技圈的热烈讨论。据AIbase了解，日日新V6在多模态能力上实现了重大突破，进一步巩固了商汤科技在AI领域的领先地位。更令人振奋的是，该模型的API将于明日正式开放，为开发者提供更强大的技术支持，助力AI应用的快速落地。多模态能力全面升级日日新V6作为商汤科技SenseNova系列的最新迭代，核心亮点在于其多模态能力的显著提升。该模型能够无缝处理文本、图像、视频等多种数据类型

2025年4月11号 10:48

1.2k

Meta 发布 Llama 4 大模型：混合专家架构引领 AI 新时代

Meta 公司推出了其最新的开源人工智能模型 Llama4，标志着其在人工智能领域的又一重大进展。Llama4分为两个版本，分别命名为 Scout 和 Maverick，旨在提升 AI 模型的功能与表现。Meta 表示，Llama4是一个多模态大模型，能够处理文本、图像、视频和音频等多种数据类型，并能在这些格式之间自由转换。值得一提的是，Llama4系列首次采用了 “混合专家”（MoE）架构，这一新颖设计极大地提高了模型的训练和响应效率。通过将模型划分为多个专注于特定任务的 “专家” 子模型，Llama4在处理复杂查询

2025年4月7号 9:47

4.5k

百度发布文心4.5与X1大模型，价格大幅降低引关注

近日，百度正式推出其最新的文心大模型4.5及文心大模型 X1，用户可在文心一言官网免费体验这两款先进的模型。文心4.5是百度首个原生多模态大模型，专注于多模态理解和逻辑推理，其性能在多项基准测试中超越了 GPT-4.5，API 调用价格仅为后者的1%。这一显著的价格优势，无疑会吸引更多开发者和企业的关注。文心大模型4.5在多模态理解方面取得了显著进展，具备了图形推理、图表分析、甚至对梗图、漫画、歌曲和电影的理解能力。在多个测试中，文心4.5的平均分达到了79.6，超过了 GPT-

2025年3月17号 10:35

3.8k

AI日报：重磅！阿里新夸克升级为“AI超级框”；谷歌开源多模态模型Gemma-3；潞晨科技开源视频大模型Open-Sora 2.0

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、阿里巴巴推出AI旗舰应用“新夸克”全面升级为“AI超级框”阿里巴巴于3月13日推出了其全新升级的AI旗舰应用——新夸克。预计到2025年，智谱将推出多款开源大模型，助力AI行业的发展，同时推动珠海的AI产业生态建设。

2025年3月13号 15:22

1.3k

阿里巴巴推出AI旗舰应用“新夸克” 全面升级为“AI超级框”

阿里巴巴宣布推出AI旗舰应用——新夸克。新夸克基于阿里通义领先的推理及多模态大模型，全面升级为一个无边界的“AI超级框”。“新夸克” 不仅具备强大的推理能力，还能够实现多模态的交互，用户在使用过程中可以与 AI 进行实时互动。AI 将根据用户的需求进行思考与执行，并在此过程中不断调整策略，以确保最终任务的顺利完成。这一创新的设计使得用户在享受便捷的同时，也能感受到与 AI 的紧密连接。阿里巴巴表示，新夸克将告别传统搜索，升级为一个All in One的“AI超级框”，

2025年3月13号 13:53

3.5k

阿里巴巴推出AI旗舰应用“新夸克” 全面升级为“AI超级框”

3月13日，阿里巴巴正式推出其AI旗舰应用——新夸克。这款全新升级的夸克基于阿里通义领先的推理及多模态大模型，打造了一个无边界的“AI超级框”，为用户带来全新的AI体验。

2025年3月13号 11:29

3.5k

谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

谷歌 CEO 桑达尔・皮查伊（Sundar Pichai）在一场发布会上宣布，谷歌开源了最新的多模态大模型 Gemma-3，该模型以低成本、高性能为特点，备受关注。Gemma-3提供了四种不同参数规模的选项，分别为10亿、40亿、120亿和270亿参数。令人惊讶的是，最大参数的270亿模型只需一张 H100显卡即可高效推理，而同类模型往往需要十倍的算力，这使 Gemma-3成为目前算力要求最低的高性能模型之一。根据最新的测试数据，Gemma-3在各类对话模型的评比中表现不俗，仅次于知名的 DeepSeek 模型，超越了 OpenAI 的 o3-m

2025年3月13号 8:52

2.3k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图

马毅团队发现：微调多模态大模型会导致灾难性遗忘

站长之家

本文来自AIbase日报

相关AI新闻推荐

上海人工智能实验室推出升级版多模态大模型 “书生・万象 3.0”

国家超算平台发布新一代多模态大模型，推动 AI 智能体发展

商汤科技推出全新多模态大模型，布局未来交互新时代

商汤科技日日新V6震撼发布：多模态AI再升级，API明日开放！

Meta 发布 Llama 4 大模型：混合专家架构引领 AI 新时代

百度发布文心4.5与X1大模型，价格大幅降低引关注

AI日报：重磅！阿里新夸克升级为“AI超级框”；谷歌开源多模态模型Gemma-3；潞晨科技开源视频大模型Open-Sora 2.0

阿里巴巴推出AI旗舰应用“新夸克” 全面升级为“AI超级框”

阿里巴巴推出AI旗舰应用“新夸克” 全面升级为“AI超级框”

​谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍