阿里巴巴近日推出了一款名为QVQ-72B的全新多模态推理模型,该模型基于Qwen2-VL-72B构建,融合了强大的语言和视觉能力,能够处理更为复杂的推理和分析任务,标志着阿里巴巴在多模态AI领域取得了新的突破。
阿里巴巴近日推出了一款名为QVQ-72B的全新多模态推理模型,该模型基于Qwen2-VL-72B构建,融合了强大的语言和视觉能力,能够处理更为复杂的推理和分析任务,标志着阿里巴巴在多模态AI领域取得了新的突破。
近期,阿里巴巴在AI领域迎来了一位重量级人物。据业内人士透露,一位全球顶级人工智能科学家已于近期正式入职阿里巴巴,未来或将专注于AI To C业务的基础大模型研发与应用。这位科学家在工业界和学术界均拥有超过20年的经验,尤其在多模态AI领域成果丰硕,曾主导发表过上百篇大模型顶级论文。
国产大模型DeepSeek发布了全新的Janus-Pro多模态大模型,正式进军文生图领域。这一举动标志着DeepSeek在多模态AI技术上的重大突破。在GenEval和DPG-Bench基准测试中,Janus-Pro-7B不仅击败了OpenAI的DALL-E3,还超越了Stable Diffusion、Emu3-Gen等热门模型。Janus-Pro采用MIT开源协议,这意味着它可以无限制地用于商业场景。DeepSeek表示,Janus-Pro是2024年11月13日发布的JanusFlow大模型的高级版本。相比前代模型,Janus-Pro优化了训练策略,扩展了训练数据,并且模型规模更大。这些改进使得Janus-Pro在多模态理解和文本
2025年1月22日,网易有道正式发布了国内首个支持分步讲解的推理模型 “子曰 - o1”。这一模型采用14B 的小参数设计,能够在普通消费级显卡上进行高效部署,标志着国内教育领域在人工智能技术应用方面的重大进展。“子曰 - o1” 利用思维链技术,通过自我对话和纠错机制,能够在解题时输出详细的思考过程,让学生在学习中不仅能得到答案,还能理解解题的逻辑。这样的设计显著提升了模型的推理能力与逻辑准确性,非常适合教育场景中的应用。与市场上其它大规模、运行要求高的推
谷歌于2025年1月22日正式发布了其 Gemini2.0Flash Thinking 推理模型的增强版,再次夺回 Chatbot Arena 的榜首。此版本的升级主要集中在长上下文的处理能力上,能够支持高达1M token 的输入,为用户在处理长篇文本时提供了更深入的分析能力。谷歌 AI 负责人 Jeff Dean 在发布会上表示,此次实验性更新旨在提高模型的可靠性,并减少模型生成的思想与最终答案之间的矛盾。Gemini2.0Flash Thinking 不仅延续了原有版本的优点,还新增了基于思维(thoughts)增强推理能力的功能,表现出色。在技术层面,Gemini2