智谱技术团队宣布开源32B 和9B 系列的 GLM(General Language Model)模型,并正式上线了全新的交互体验平台 Z.ai。这一系列模型包括基座模型、推理模型和沉思模型,均遵循宽松的 MIT 许可协议,为开发者提供了极大的使用和开发自由度,可免费用于商业用途和自由分发。

此次开源的32B 基座模型 GLM-4-32B-0414拥有320亿参数,利用15T 高质量数据进行预训练,特别纳入了丰富的推理类合成数据。在后训练阶段,通过拒绝采样和强化学习等技术,该模型在指令遵循、工程代码生成、函数调用等任务上的表现得到了显著增强,部分 Benchmark 指标已接近甚至超越了 GPT-4o、DeepSeek-V3-0324(671B)等更大模型的水平。此外,GLM-4-32B-0414还进一步提升了代码生成能力,可处理并生成结构更复杂的单文件代码,Z.ai 的对话模式内建了预览功能,支持对生成的 HTML 和 SVG 进行可视化查看,便于用户评估生成结果和进行迭代优化。

微信截图_20250415090652.png

推理模型 GLM-Z1-32B-0414在 GLM-4-32B-0414的基础上,采用了冷启动与扩展强化学习策略,并针对数学、代码、逻辑等关键任务进行了深度优化训练。该模型在部分任务上的性能已能与拥有671B 参数的 DeepSeek-R1相媲美,展现了较强的数理推理能力,能够支持解决更广泛复杂的任务。值得一提的是,GLM-Z1-32B-0414的实测推理速度可达200Tokens/秒,是国内目前商业模型中速度最快的,其价格仅为 DeepSeek-R1的1/30。

9B 尺寸的 GLM-Z1-9B-0414模型沿用了上述一系列技术,虽然参数量更少,但在数学推理及通用任务上依然表现出色,整体性能已跻身同尺寸开源模型的领先水平。特别是在资源受限的场景下,该模型可以很好地在效率与效果之间取得平衡,为需要轻量化部署的用户提供强有力的选择。

沉思模型 GLM-Z1-Rumination-32B-0414代表了智谱对 AGI(Artificial General Intelligence,通用人工智能)未来形态的下一步探索。与一般推理模型不同,沉思模型通过更多步骤的深度思考来解决高度开放与复杂的问题。其关键创新在于,它能在深度思考过程中整合搜索工具处理复杂任务,并运用多种规则型奖励机制来指导和扩展端到端的强化学习训练。该模型支持“自主提出问题—搜索信息—构建分析—完成任务”的完整研究闭环,从而在研究型写作和复杂检索任务上的能力得到了显著提升。

微信截图_20250415090630.png

除模型开源外,基座、推理两类模型也已同步上线智谱 MaaS 开放平台(bigmodel.cn),面向企业与开发者提供 API 服务。本次上线的基座模型提供两个版本:GLM-4-Air-250414和 GLM-4-Flash-250414,其中后者完全免费。上线的推理模型分为三个版本,分别满足不同场景需求:GLM-Z1-AirX(极速版)定位国内最快推理模型,推理速度可达200tokens/秒,比常规快8倍;GLM-Z1-Air(高性价比版)价格仅为 DeepSeek-R1的1/30,适合高频调用场景;GLM-Z1-Flash(免费版)支持免费使用,旨在进一步降低模型使用门槛。

与此同时,智谱启用了全新域名 Z.ai,该平台整合了32B 基座、推理、沉思三类 GLM 模型,作为智谱最新模型的交互体验入口,目前已上线三款开源模型,用户可以在该平台上免费体验这些模型的强大功能。