在2024年12月19日的发布会上,智源研究院与腾讯宣布推出LongBench v2,这是一个专为评估大语言模型(LLMs)在真实世界长文本多任务中的深度理解与推理能力而设计的基准测试。该平台旨在推动长文本模型在理解和推理方面的进步,回应了当前长文本大语言模型在应用中的挑战。
商汤科技近日宣布其办公工具小浣熊升级至2.0版本,进化为“AI原生一站式创作空间”,集成了多种AI功能以提高办公效率。新版本的核心功能围绕“浣熊三步法(PAW)”展开,即规划(Plan)、分析(Analyze)、写作(Write),旨在覆盖工作和学习的多个方面。办公小浣熊2.0在数据分析能力上进行了增强,并新增了文档解析能力,能够化繁为简,省时高效。
智谱科技近日宣布开源其端侧大语言和多模态模型GLM-Edge系列,这一举措标志着公司在端侧真实落地使用场景中的一次重要尝试。GLM-Edge系列由四种不同尺寸的模型组成,包括GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B和GLM-Edge-V-5B,分别针对手机、车机等移动平台以及PC等桌面平台进行了优化。
通义宣布旗下的大语言模型通义App现已推出鸿蒙原生版,并已在华为应用市场上线。用户可以下载体验这款全能AI助手带来的最新功能,享受更加丰富和个性化的服务。通义App已完成手机、折叠屏、Pad等多端适配,基于鸿蒙系统的特性,优化了界面交互设计,确保操作的便捷性和视觉的舒适度。鸿蒙系统为通义App提供了良好的运行环境,满足用户在生活、工作、学习等多个场景下的需求。