阿里巴巴近日推出了一款名为QVQ-72B的全新多模态推理模型,该模型基于Qwen2-VL-72B构建,融合了强大的语言和视觉能力,能够处理更为复杂的推理和分析任务,标志着阿里巴巴在多模态AI领域取得了新的突破。
阿里发布多模态推理模型QVQ-72B!视觉、语言能力双提升,复杂问题迎刃而解

阿里巴巴近日推出了一款名为QVQ-72B的全新多模态推理模型,该模型基于Qwen2-VL-72B构建,融合了强大的语言和视觉能力,能够处理更为复杂的推理和分析任务,标志着阿里巴巴在多模态AI领域取得了新的突破。
人工智能初创公司 Cohere 的非营利研究实验室本周发布了一款多模态 “开放” AI 模型 ——Aya Vision。该实验室声称,该模型在行业内处于领先地位。Aya Vision 能够执行多项任务,包括撰写图片说明、回答与照片相关的问题、翻译文本以及生成23种主要语言的摘要。Cohere 表示,他们通过 WhatsApp 免费提供 Aya Vision,希望能让世界各地的研究人员更方便地获取技术突破。Cohere 在其博客中指出,尽管人工智能已经取得了显著进展,但在不同语言之间的模型表现仍存在很大差距,尤其是在涉及文本和
AI圈再掀巨浪!阿里巴巴震撼发布并全面开源了其最新力作——通义千问QwQ-32B推理模型。这款被寄予厚望的新模型,并非徒有虚名,而是经过大规模强化学习的千锤百炼,在硬核的数学运算、复杂的代码编写以及通用的AI能力上实现了质的飞跃,整体性能已经能够正面硬刚行业标杆DeepSeek-R1,实力不容小觑。更令人兴奋的是,通义千问QwQ-32B一举打破了高性能AI模型“高价难用”的魔咒。它如同AI界的“平民英雄”,大幅降低了部署和使用门槛,即使是普通玩家的消费级显卡,也能轻松驾驭,实
通义灵码宣布上线其最新推理模型Qwen2.5-Max,为开发者带来强大的编程和数学能力支持。Qwen2.5-Max使用了超过20万亿token的预训练数据,并结合精心设计的后训练方案,展现出卓越的性能。
微软在其官网上正式发布了多模态 AI Agent 基础模型 “Magma”,并进行了开源。这一新兴技术相较于传统的智能助手,展现出了更为强大的多模态能力,能够处理图像、视频、文本等多种数据形式,打破了数字与物理世界之间的壁垒。Magma 不仅可以帮助用户在电商平台上自动下单,查询天气等日常事务,还能与实体机器人协作,执行更复杂的操作。比如,在下真实象棋时,Magma 能够为用户提供实时的策略建议,大大增强了游戏体验。同时,它具备心理预测功能,能够推测视频中的人物或物体