智谱AI开源端侧大语言和多模态模型GLM-Edge系列

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年11月30号 10:01

276

智谱科技近日宣布开源其端侧大语言和多模态模型GLM-Edge系列，这一举措标志着公司在端侧真实落地使用场景中的一次重要尝试。GLM-Edge系列由四种不同尺寸的模型组成，包括GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B和GLM-Edge-V-5B，分别针对手机、车机等移动平台以及PC等桌面平台进行了优化。

智谱 AI

基于GLM-4系列的技术积累，智谱的研究团队对模型结构和尺寸进行了调整，以实现模型性能、实机推理效果和落地便利度之间的最佳平衡。通过与合作伙伴的深入合作和推理优化，GLM-Edge系列模型在一些端侧平台上展现出了卓越的运行速度。特别是在高通骁龙8Elite平台上，借助NPU算力和混合量化方案，1.5B对话模型和2B多模态模型能够实现每秒60tokens以上的解码速度，应用投机采样技术后，解码速度更是能达到每秒100tokens以上。

智谱开源的GLM-Edge系列模型不仅展示了公司在人工智能领域的技术实力，也为开发者和研究者提供了强大的工具和资源，以促进端侧AI应用的发展和创新。

GLM-Edge合集:

https://modelscope.cn/collections/GLM-Edge-ff0306563d2844

出门问问发布小问移动数字人完美适配各种场景

近日，在全球开发者先锋大会（GDC）上，出门问问公司正式推出了其最新产品——小问移动数字人。该产品凭借其灵活可移动的身体、高智商的问答能力以及流畅的交互体验，吸引了众多现场参观者的目光，成为了大会的一大亮点。

阿里国际开源Ovis2系列多模态大语言模型共有六个版本

Ovis2 是阿里巴巴国际化团队提出的Ovis系列模型的最新版本。与前序1. 6 版本相比，Ovis2 在数据构造和训练方法上都有显著改进。它不仅强化了小规模模型的能力密度，还通过指令微调和偏好学习大幅提升了思维链（CoT）推理能力。此外，Ovis2 引入了视频和多图像处理能力，并增强了多语言能力和复杂场景下的OCR能力，显著提升了模型的实用性。

AI大语言模型幻觉排行榜：Gemini 2.0 Flash幻觉最低

近日，Vectara 发布了一份名为 “幻觉排行榜” 的报告，比较了不同大型语言模型（LLM）在总结短文档时产生幻觉的表现。这份排行榜利用了 Vectara 的 Hughes 幻觉评估模型(HHEM-2.1)，该模型定期更新，旨在评估这些模型在摘要中引入虚假信息的频率。根据最新数据，报告指出了一系列流行模型的幻觉率、事实一致性率、应答率以及平均摘要长度等关键指标。在最新的排行榜中，谷歌的 Gemini2.0系列表现出色，尤其是 Gemini-2.0-Flash-001，以0.7% 的低幻觉率位居榜首，显示出其在处理文档时几乎没有引