Qwen团队近日宣布开源其最新研发的多模态推理模型QVQ,标志着人工智能在视觉理解和复杂问题解决能力方面迈出了重要一步。该模型基于Qwen2-VL-72B构建,旨在通过结合语言和视觉信息,提升AI的推理能力。在MMMU评测中,QVQ取得了70.3的高分,并在多项数学相关基准测试中相较Qwen2-VL-72B-Instruct显示出显著的性能提升。
近日,IBM 宣布推出其开源语言模型 Granite 的3.1版本,此次更新带来了诸多重要改进。新版本的模型经过重新设计,采用了更加密集的架构,能够一次处理多达128,000个令牌。这一更新意味着 Granite 在处理复杂文本和任务时的能力得到了显著增强。Granite3.1版本的模型经过了12种语言和116种编程语言的数据集训练,总共处理了12万亿个令牌。这使得模型在语言理解和生成方面的表现更加出色,能够更好地满足用户的需求。IBM 表示,这些新模型在回答使用外部数据的问题(RAG)、从非结构化文本
据第一财经报道,DeepSeek 开源大模型 DeepSeek-V2的关键开发者罗福莉将加入小米,担任小米 AI 实验室的领导,并负责大模型团队的建设。这一消息引起了广泛关注,尤其是在小米计划加强其在大模型领域的布局之际。图源备注:图片由AI生成,图片授权服务商Midjourney据知情人士透露,小米创始人雷军对公司在 AI 大模型领域的起步较晚表示担忧,因此决定高薪挖角罗福莉。罗福莉的背景相当亮眼,她拥有北京大学计算语言学研究所的硕士学位,并在自然语言处理领域的顶级会议 ACL2019上发表了
开源AI模型管理工具Pinokio发布3.0版本,带来界面自定义、包管理优化和浏览器自动化等重要新功能,进一步简化了用户在本地部署和运行开源AI模型的流程。Pinokio 现在显示每个应用程序使用的磁盘空间量。此次更新的核心亮点包括:界面定制功能全面升级,用户现在可以通过CSS代码自由调整起始页、应用页面和终端的外观;包管理系统切换到UV作为Python的原生包管理器,提升了新包安装速度;新增磁盘空间占用显示功能,方便用户管理已安装应用;错误提示系统得到优化,取代了此前模糊的"ENO