在2024年12月19日的发布会上,智源研究院与腾讯宣布推出LongBench v2,这是一个专为评估大语言模型(LLMs)在真实世界长文本多任务中的深度理解与推理能力而设计的基准测试。该平台旨在推动长文本模型在理解和推理方面的进步,回应了当前长文本大语言模型在应用中的挑战。
智谱科技近日宣布开源其端侧大语言和多模态模型GLM-Edge系列,这一举措标志着公司在端侧真实落地使用场景中的一次重要尝试。GLM-Edge系列由四种不同尺寸的模型组成,包括GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B和GLM-Edge-V-5B,分别针对手机、车机等移动平台以及PC等桌面平台进行了优化。
通义宣布旗下的大语言模型通义App现已推出鸿蒙原生版,并已在华为应用市场上线。用户可以下载体验这款全能AI助手带来的最新功能,享受更加丰富和个性化的服务。通义App已完成手机、折叠屏、Pad等多端适配,基于鸿蒙系统的特性,优化了界面交互设计,确保操作的便捷性和视觉的舒适度。鸿蒙系统为通义App提供了良好的运行环境,满足用户在生活、工作、学习等多个场景下的需求。
美国云计算软件公司 Salesforce 的首席执行官马克・贝奥夫(Marc Benioff)近日在《华尔街日报》的《未来一切》播客上表示,人工智能的未来在于自主代理(autonomous agents),而不是大型语言模型(LLMs)所驱动的聊天机器人。他指出,当前我们正处于大型语言模型的上限阶段。贝尼奥夫提到,过去几年,大家对 ChatGPT 的热情过于高涨,导致普通消费者认为人工智能的能力远超实际。他认为,大型语言模型并不是技术进步的关键,未来的 AI 发展应集中于能够独立执行任务的自主代理。例如,这些代