AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

Al硬件

列出所有AI硬件产品。

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

智谱GLM-4-9B模型幻觉率仅1.3%，在全球大模型评测中夺魁

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Jan 10, 2025

366

在人工智能领域，大语言模型的"幻觉问题"一直是困扰业界的关键挑战。近日，一项基于HHEM-2.1-Open评估体系的测试结果显示，智谱AI旗下的GLM-4-9B模型交出了一份令人瞩目的成绩单。

测试数据显示，在参与评估的85个大语言模型中，GLM-4-9B以98.7%的事实一致性率和100%的回答率摘得桂冠。特别值得关注的是，该模型的幻觉率仅为1.3%，这一成绩不仅位居榜首，更是超越了行业巨头OpenAI的GPT系列和Google的Gemini系列模型。

机器人元宇宙科幻

图源备注：图片由AI生成，图片授权服务商Midjourney

这一突破性成果标志着中国大语言模型在降低"幻觉率"方面取得重要进展，为提升AI应用的可靠性和准确性带来新的可能。这不仅体现了智谱AI在模型研发上的技术实力，也为全球AI领域树立了新的标杆。

在当前AI技术竞争日益激烈的背景下，GLM-4-9B模型的出色表现无疑将为智谱AI赢得更多关注，同时也为中国AI企业在国际舞台上赢得了更多话语权。

大语言模型智谱AI GLM-4-9B 幻觉问题

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

AI日报：智谱开源32B/9B系列GLM模型并启用Z.ai域名；OpenAI发布GPT-4.1系列模型；阿里魔搭上线MCP广场

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、智谱AI启用全新域名Z.ai 并开源 32B/9B 系列 GLM 模型智谱技术团队近期宣布开源32B和9B系列的GLM模型，并推出全新交互体验平台Z.ai。这些模型遵循MIT许可协议，支持商业用途，提升了开发者的使用自由度。GLM-4-32B-0414模型在多个任务上表现优异，甚至超越了部分大型模型。【AiBase提要:】🆓 开源

2025年4月15号 15:44

260

智谱开源32B/9B 系列 GLM 模型，32B参数媲美DeepSeek R1，速度快8倍

备受瞩目的国内人工智能企业智谱华章（以下简称“智谱”）近日正式宣布，开源其新一代 GLM 系列大语言模型。此次开源力度空前，不仅包含 32B 和9B 两种参数规模的模型，更涵盖了基座模型、推理模型以及代表未来探索方向的沉思模型。所有开源模型均遵循宽松的 MIT 许可协议，为开发者提供了极大的自由度和商业应用的可能性。与此同时，该系列模型已通过智谱全新平台 Z.ai 免费开放体验，并同步上线智谱 MaaS 平台（bigmodel.cn）。开源赋能:技术普惠与创新加速本次智谱开源的 GLM 模

2025年4月15号 10:52

2.2k

智谱全新站点 http://z.ai 正式启用

北京智谱华章科技有限公司（以下简称智谱）全新官方网站 https://z.ai 已全面上线。据 AIbase 了解，该平台集成了最新的对话、推理与沉思三款 GLM 模型，自今日起全面向全球用户免费开放使用。

2025年4月15号 9:55

1.7k

智谱AI正式启动IPO流程，大模型“六小龙”迎来新篇章

据证券时报消息，国内大模型领域领军企业智谱AI已正式启动首次公开募股（IPO）流程，成为业内备受瞩目的焦点。据悉，智谱2025年4月14日在北京证监局办理辅导备案，辅导机构为中国国际金融股份有限公司。作为“大模型六小龙”（智谱AI、月之暗面、百川智能、MiniMax、零一万物、阶跃星辰）之一，智谱AI的这一里程碑标志着中国AI初创企业迈向资本市场的重要一步。智谱AI成立于2019年，依托清华大学计算机系的技术积累，专注于大模型研发与商业化应用。其核心产品包括GLM系列大模型、

2025年4月15号 9:36

950

智谱AI启用全新域名Z.ai 并开源 32B/9B 系列 GLM 模型

智谱技术团队宣布开源32B 和9B 系列的 GLM（General Language Model）模型，并正式上线了全新的交互体验平台 Z.ai。这一系列模型包括基座模型、推理模型和沉思模型，均遵循宽松的 MIT 许可协议，为开发者提供了极大的使用和开发自由度，可免费用于商业用途和自由分发。

2025年4月15号 9:07

1.1k

清华与上海 AI Lab 联合打造新型过程奖励模型GenPRM，让小模型超越 GPT-4o

在人工智能领域，随着 OpenAI 的 o1和 DeepSeek 的 R1模型受到广泛关注，大语言模型（LLM）的推理能力和测试时扩展(TTS)技术引发了众多研究者的兴趣。然而，在处理复杂推理问题时，如何准确评估模型每一步的回答质量，依然是一个亟待解决的难题。为此，清华大学与上海 AI Lab 共同提出了生成式过程奖励模型(GenPRM)，为过程监督推理提供了创新解决方案。传统的过程奖励模型（PRM）虽然能够验证推理步骤的正确性，但由于采用了标量评分机制，难以捕捉深层次的逻辑错误。此外，PRM 的判别式

2025年4月14号 14:02

1.8k

预训练不等于更强大，研究揭示大语言模型的 “灾难性过度训练” 现象

近日，来自卡内基梅隆大学、斯坦福大学、哈佛大学和普林斯顿大学的研究人员揭示了一个关于大语言模型（LLMs）训练的新发现:并不是预训练的数据越多，模型的表现就越好。相反，他们指出，过度的预训练可能会导致模型性能下降，出现一种被称为 “灾难性过度训练” 的现象。在一项研究中，研究者们对 OLMo-1B 模型进行了比较，分别对其进行了2.3万亿和3万亿个标记的训练。出乎意料的是，虽然第二个模型接受了更多的数据训练，但其在一些基准测试（例如 AlpacaEval 和 ARC）的表现却下

2025年4月14号 11:16

1.5k

北大研发全球首个基因挖掘大模型 SYMPLEX，助力生物制造新时代

近日，北京大学定量生物学中心的钱珑团队成功研发出全球首个专门用于功能基因挖掘的大语言模型 SYMPLEX。这一创新的模型能够从海量的生物文献中高效筛选出具有特定功能的关键基因，推动生物科技的发展。SYMPLEX 的问世，标志着基因挖掘技术进入了一个全新的阶段。团队利用这一模型，进行 mRNA 加帽酶基因的挖掘，并取得了显著的成果:新发现的加帽酶活性远超目前用于 mRNA 疫苗生产的商业化酶。这一成果不仅展示了大语言模型在生物制造领域的巨大潜力，也为未来的疫苗生产提供了

2025年4月14号 10:57

1.2k

MCP生态崛起，六行代码打造智能AI代理

随着人工智能技术的飞速发展，模型上下文协议（Model Context Protocol，MCP）生态正在成为连接大语言模型(LLM)与外部工具的桥梁，赋予AI前所未有的操作能力。MCP作为由Anthropic于2024年11月推出的开源协议，旨在标准化LLM与外部数据源和工具的交互方式。开发者们称其为“AI的USB-C接口”。通过MCP，LLM可以轻松调用网页搜索、文件操作甚至3D建模软件等工具，突破传统模型的局限。核心功能:多场景赋能智能代理MCP生态通过mcp-use提供了多项强大功能，显著提升了LLM的实用性与灵活性:广泛的模型兼

2025年4月14号 9:44

2.4k

字节跳动推出Seed-Thinking-v1.5:推理AI竞赛中的新力量

字节跳动加入了快速发展的AI推理模型竞争，推出了专注于科学、技术、数学和工程（STEM）领域的新型大语言模型Seed-Thinking-v1.5。这款采用混合专家(MoE)架构的模型在多项基准测试中表现优异，甚至在某些指标上超越了行业巨头的产品。推理AI的演进历程推理AI竞赛始于2024年9月OpenAI的o1模型发布，而后在2025年1月DeepSeek R1的推出后真正加速。如今，主要AI企业都在竞相开发能够执行"思路链"推理的模型，以提供更全面、更合理的回答。Seed-Thinking-v1.5采用了流行的混合专家（MoE）架构，类似于Me

2025年4月14号 9:02

590

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图