近期,国产大模型DeepSeek V3在AI竞技场的优异表现引发业界关注。作为唯一闯入前十的开源模型,它不仅超越了o1-mini,在编程、数学等多个领域甚至超过了Claude3.5Sonnet。为验证其实际能力,多方展开了一系列实测对比。在基础理解能力测试中,两个模型展现出不同特点。面对中文脑筋急转弯"小明的妈妈有三个孩子"的问题,DeepSeek V3表现出色,不仅答对还进行了自我验证。但在英文双关语"April Fools Day"的测试中则略显不足,未能理解其中的语言巧思,而Claude3.5Sonnet则轻松应对。逻辑推理测试
国内人工智能公司无问芯穹宣布开源其最新研发的端侧全模态理解 AI 模型 ——Megrez-3B-Omni。这一模型是全球首个此类开源项目,标志着该公司在 AI 领域的创新发展。与此同时,无问芯穹还推出了纯语言版本的模型 Megrez-3B-Instruct,以进一步丰富其产品线。无问芯穹成立于2023年5月,创始团队来自清华大学电子工程系。公司致力于打造高效的 AI 计算优化能力,以实现大模型的有效落地。其独特的解决方案包括 “端模型 + 端软件 + 端 IP” 的一体化智能系统,力求在多个芯片上实现多种大模型
在 AI 时代,大型语言模型(LLM)就像武林秘籍,其训练过程耗费巨大算力、数据,就像闭关修炼多年的武林高手。而开源模型的发布,就像高手将秘籍公之于众,但会附带一些许可证(如 Apache2.0和 LLaMA2社区许可证)来保护其知识产权(IP)。然而,江湖险恶,总有“套壳”事件发生。一些开发者声称自己训练了新的 LLM,实际上却是在其他基础模型(如 Llama-2和 MiniCPM-V)上进行包装或微调。 这就好像偷学了别人的武功,却对外宣称是自己原创的。为了防止这种情况发生,模型所有者和第三方迫
在2024年世界互联网大会乌镇峰会期间,阿里巴巴集团首席执行官吴泳铭于11月21日在互联网企业家论坛上发表了主题演讲,强调了人工智能(AI)对互联网行业的深远影响。他指出,今年互联网行业最大的变化依然是 AI 技术的迅速发展。吴泳铭表示,AI最大的价值绝不仅仅是在手机上做出一两个超级App,而是推动各行各业的生产力变革。发展AI需要建设繁荣的技术、产品和市场生态。目前,已有超过30万家企业接入阿里巴巴的通义大模型,利用 AI 技术重塑代码开发、药物研发、生产制造等多