近期,国产大模型DeepSeek V3在AI竞技场的优异表现引发业界关注。作为唯一闯入前十的开源模型,它不仅超越了o1-mini,在编程、数学等多个领域甚至超过了Claude3.5Sonnet。为验证其实际能力,多方展开了一系列实测对比。在基础理解能力测试中,两个模型展现出不同特点。面对中文脑筋急转弯"小明的妈妈有三个孩子"的问题,DeepSeek V3表现出色,不仅答对还进行了自我验证。但在英文双关语"April Fools Day"的测试中则略显不足,未能理解其中的语言巧思,而Claude3.5Sonnet则轻松应对。逻辑推理测试
国内人工智能公司无问芯穹宣布开源其最新研发的端侧全模态理解 AI 模型 ——Megrez-3B-Omni。这一模型是全球首个此类开源项目,标志着该公司在 AI 领域的创新发展。与此同时,无问芯穹还推出了纯语言版本的模型 Megrez-3B-Instruct,以进一步丰富其产品线。无问芯穹成立于2023年5月,创始团队来自清华大学电子工程系。公司致力于打造高效的 AI 计算优化能力,以实现大模型的有效落地。其独特的解决方案包括 “端模型 + 端软件 + 端 IP” 的一体化智能系统,力求在多个芯片上实现多种大模型
在 AI 时代,大型语言模型(LLM)就像武林秘籍,其训练过程耗费巨大算力、数据,就像闭关修炼多年的武林高手。而开源模型的发布,就像高手将秘籍公之于众,但会附带一些许可证(如 Apache2.0和 LLaMA2社区许可证)来保护其知识产权(IP)。然而,江湖险恶,总有“套壳”事件发生。一些开发者声称自己训练了新的 LLM,实际上却是在其他基础模型(如 Llama-2和 MiniCPM-V)上进行包装或微调。 这就好像偷学了别人的武功,却对外宣称是自己原创的。为了防止这种情况发生,模型所有者和第三方迫
根据市场研究机构 Omdia 的最新报告,全球生成式人工智能(AI)市场仍处于起步阶段,预计将在未来五年内实现五倍增长,从2024年的146亿美元跃升至2029年的728亿美元。这个市场的增长主要受到消费类、企业服务、零售、媒体娱乐和医疗保健等领域的推动。图源备注:图片由AI生成,图片授权服务商Midjourney生成式 AI 的应用领域正不断扩展,其中多模态生成式 AI 技术被认为是下一个前沿,因其能够实现多样化的功能,正在推动各行业的应用案例。具体而言,这些技术已经在客户服务、企业知