Qwen3即将来袭：阿里云新模型相关支持已正式合并至vLLM代码库

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Apr 8, 2025

1.1k

近日，阿里云旗下人工智能大模型系列Qwen迎来重要进展，其下一代模型Qwen3的相关支持已正式合并至vLLM（高效大语言模型推理框架）的代码库中。这一消息迅速引发了科技圈的热烈讨论，标志着Qwen3的发布已进入倒计时阶段。据悉，Qwen3将包含至少两个版本:Qwen3-8B和Qwen3-MoE-15B-A2B，分别代表不同规模和架构的创新尝试，为开发者与企业用户带来了更多期待。

Qwen3-8B作为系列中的基础模型，预计将延续Qwen家族在语言理解与生成任务上的优异表现。业界推测，这一版本可能在多模态能力上有所突破，能够同时处理文本、图像甚至其他数据类型，从而满足更广泛的应用场景需求。与此同时，Qwen3-MoE-15B-A2B则采用了混合专家（Mixture-of-Experts， MoE）架构，拥有15亿参数，其中约2亿为活跃参数。这种设计旨在通过高效的专家路由机制，在保持较低计算成本的同时实现接近更大模型的性能表现。分析人士指出，若Qwen3-MoE-15B-A2B能在性能上媲美此前的Qwen2.5-Max(一款以高智能著称的模型)，其在实际应用中的潜力将不可小觑。

此次vLLM对Qwen3的支持合并，意味着开发者将能够利用这一高性能推理框架，轻松部署Qwen3模型以实现快速、稳定的推理任务。vLLM以其高效的内存管理和并行处理能力闻名，能够显著提升大模型在生产环境中的运行效率。这一进展不仅为Qwen3的落地应用铺平了道路，也进一步巩固了阿里云在开源AI生态中的影响力。

尽管Qwen3的具体功能和性能细节尚未完全公开，业界对其寄予厚望。Qwen2.5系列此前已在编码、数学推理和多语言任务中展现出超越同行的实力，而Qwen3被期待在这些领域进一步突破，尤其是在资源受限环境下的表现。MoE架构的引入也引发了讨论:相比传统密集模型，Qwen3-MoE-15B-A2B可能在能效比上更具优势，适合部署在边缘设备或中小型服务器上。然而，也有声音认为，15亿参数的规模相对较小，是否能完全满足复杂任务的需求仍需实测验证。

阿里云近年来在AI领域的持续投入已使其成为全球开源模型开发的重要力量。从Qwen1.5到Qwen2.5，每一代模型的迭代都伴随着技术与生态的双重进步。Qwen3的到来，不仅是阿里云技术升级的体现，也是在全球AI竞赛中抢占先机的重要一步。可以预见，随着更多细节的披露和模型的正式发布，Qwen3将在开发社区和企业应用中掀起新的热潮，为从智能助手到自动化流程的多种场景注入新的活力。

Qwen3 阿里云大语言模型 vLLM

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

清华与上海 AI Lab 联合打造新型过程奖励模型GenPRM，让小模型超越 GPT-4o

在人工智能领域，随着 OpenAI 的 o1和 DeepSeek 的 R1模型受到广泛关注，大语言模型（LLM）的推理能力和测试时扩展(TTS)技术引发了众多研究者的兴趣。然而，在处理复杂推理问题时，如何准确评估模型每一步的回答质量，依然是一个亟待解决的难题。为此，清华大学与上海 AI Lab 共同提出了生成式过程奖励模型(GenPRM)，为过程监督推理提供了创新解决方案。传统的过程奖励模型（PRM）虽然能够验证推理步骤的正确性，但由于采用了标量评分机制，难以捕捉深层次的逻辑错误。此外，PRM 的判别式

2025年4月14号 14:02

1.4k

预训练不等于更强大，研究揭示大语言模型的 “灾难性过度训练” 现象

近日，来自卡内基梅隆大学、斯坦福大学、哈佛大学和普林斯顿大学的研究人员揭示了一个关于大语言模型（LLMs）训练的新发现:并不是预训练的数据越多，模型的表现就越好。相反，他们指出，过度的预训练可能会导致模型性能下降，出现一种被称为 “灾难性过度训练” 的现象。在一项研究中，研究者们对 OLMo-1B 模型进行了比较，分别对其进行了2.3万亿和3万亿个标记的训练。出乎意料的是，虽然第二个模型接受了更多的数据训练，但其在一些基准测试（例如 AlpacaEval 和 ARC）的表现却下

2025年4月14号 11:16

1.1k

北大研发全球首个基因挖掘大模型 SYMPLEX，助力生物制造新时代

近日，北京大学定量生物学中心的钱珑团队成功研发出全球首个专门用于功能基因挖掘的大语言模型 SYMPLEX。这一创新的模型能够从海量的生物文献中高效筛选出具有特定功能的关键基因，推动生物科技的发展。SYMPLEX 的问世，标志着基因挖掘技术进入了一个全新的阶段。团队利用这一模型，进行 mRNA 加帽酶基因的挖掘，并取得了显著的成果:新发现的加帽酶活性远超目前用于 mRNA 疫苗生产的商业化酶。这一成果不仅展示了大语言模型在生物制造领域的巨大潜力，也为未来的疫苗生产提供了

2025年4月14号 10:57

940

MCP生态崛起，六行代码打造智能AI代理

随着人工智能技术的飞速发展，模型上下文协议（Model Context Protocol，MCP）生态正在成为连接大语言模型(LLM)与外部工具的桥梁，赋予AI前所未有的操作能力。MCP作为由Anthropic于2024年11月推出的开源协议，旨在标准化LLM与外部数据源和工具的交互方式。开发者们称其为“AI的USB-C接口”。通过MCP，LLM可以轻松调用网页搜索、文件操作甚至3D建模软件等工具，突破传统模型的局限。核心功能:多场景赋能智能代理MCP生态通过mcp-use提供了多项强大功能，显著提升了LLM的实用性与灵活性:广泛的模型兼

2025年4月14号 9:44

2.2k

字节跳动推出Seed-Thinking-v1.5:推理AI竞赛中的新力量

字节跳动加入了快速发展的AI推理模型竞争，推出了专注于科学、技术、数学和工程（STEM）领域的新型大语言模型Seed-Thinking-v1.5。这款采用混合专家(MoE)架构的模型在多项基准测试中表现优异，甚至在某些指标上超越了行业巨头的产品。推理AI的演进历程推理AI竞赛始于2024年9月OpenAI的o1模型发布，而后在2025年1月DeepSeek R1的推出后真正加速。如今，主要AI企业都在竞相开发能够执行"思路链"推理的模型，以提供更全面、更合理的回答。Seed-Thinking-v1.5采用了流行的混合专家（MoE）架构，类似于Me

2025年4月14号 9:02

320

马云在阿里云新财年启动会上强调AI应服务人类

在杭州云谷园区举行的阿里云新财年启动会上，马云发表演讲，分享了他对科技与AI发展的理念。马云强调高科技不仅是征服星辰大海，更应该呵护人间烟火，科技的真正意义在于让普通人生活得更好、更有尊严。图源备注：图片由AI生成，图片授权服务商Midjourney马云表示，阿里云拥有的资源和技术人才既是发展云计算和AI的信心所在，也是责任所在。他指出科技发展的目标不是追求让机器像人，而是让机器理解人类、像人类一样思考，并完成人类做不到的事情。"未来不是让AI取代人类，而

2025年4月11号 9:06

1.9k

阿里云全新 MCP 服务上线，高德、无影等首批接入

阿里云正式推出了全生命周期的 MCP（Model-Connect-Protocol）服务，这一创新平台的上线标志着大模型应用开发的门槛得以大幅降低。用户只需花费5分钟，就可以快速创建连接 MCP 服务的智能体(Agent)，实现从资源管理到部署运维的全流程自动化，大大提升了开发效率。MCP 协议作为大模型连接软件的行业标准，正在吸引越来越多的应用接入，生态系统呈现出爆发式增长。此次阿里云百炼平台首批集成了50余款阿里巴巴集团及第三方的 MCP 服务，涵盖了生活服务、办公协同、内容创作等多个领域，

2025年4月9号 20:38

13.1k

OpenRouter调整API政策：重新定义免费与付费模型调用限制

2025 年 4 月 9 日报道：知名大语言模型API聚合服务商OpenRouter近日宣布重大政策调整，对其免费模型调用限制进行了显著变更。根据最新消息，该平台已将每日免费模型调用次数从原先的 200 次调整至 50 次，同时推出新的激励措施——账户余额超过 10 美元的用户将享有每日 1000 次的调用上限。这一政策变更在开发者社区引发了广泛讨论，反映了AI服务提供商在快速发展市场中的战略调整。政策调整的核心内容OpenRouter此次调整的具体内容包括以下几个关键方面：免费模型使用限制调整：对标记

2025年4月9号 10:19

5.1k

英伟达震撼发布Llama 3.1 Nemotron Ultra 253B：AI性能王者再定义行业新标杆

近日，全球芯片与AI技术巨头英伟达（NVIDIA）推出了一款全新开源大语言模型——Llama3.1Nemotron Ultra253B，引发了人工智能领域的强烈反响。这一模型基于Meta的Llama-3.1-405B打造，通过创新技术优化，不仅在性能上超越了Llama4Behemoth和Maverick等强劲对手，还以高效的资源利用率和卓越的多任务能力，为AI应用的广泛落地提供了新的可能。Llama3.1Nemotron Ultra253B拥有2530亿个参数，支持高达128K token的超长上下文长度，使其能够轻松处理复杂文本输入并保持逻辑连贯性。与前代模型相比，该版本在推理、

2025年4月9号 9:26

1.4k

AI日报：阿里新模型Qwen3即将来袭；GitHub开源MCP服务器；Runway发布Gen-4 Turbo

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、Qwen3即将来袭：阿里云新模型相关支持已正式合并至vLLM代码库阿里云的Qwen3模型即将发布，标志着其在AI领域的又一重要进展。新推出的AI听歌报告能够精准识别用户音乐偏好，场景推荐系统和智能歌单管家提升了用户创作效率。

2025年4月8号 15:26

7.7k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图