零一万物公司宣布开源Yi-9B模型,该模型是Yi系列中代码和数学能力最强的,实际参数为8.8B,默认上下文长度为4K tokens。Yi-9B在综合能力、代码能力、数学能力方面均表现优异,超越了其他开源模型。同时,Yi-9B可以轻松部署在消费级显卡上,使用成本较低,开发者友好。公司由李开复创新工场董事长兼CEO创办,之前已推出Yi-34B和Yi-6B两个开源大模型,对学术研究完全开放,同步免费商用申请。
零一万物公司宣布开源Yi-9B模型,该模型是Yi系列中代码和数学能力最强的,实际参数为8.8B,默认上下文长度为4K tokens。Yi-9B在综合能力、代码能力、数学能力方面均表现优异,超越了其他开源模型。同时,Yi-9B可以轻松部署在消费级显卡上,使用成本较低,开发者友好。公司由李开复创新工场董事长兼CEO创办,之前已推出Yi-34B和Yi-6B两个开源大模型,对学术研究完全开放,同步免费商用申请。
国内人工智能公司无问芯穹宣布开源其最新研发的端侧全模态理解 AI 模型 ——Megrez-3B-Omni。这一模型是全球首个此类开源项目,标志着该公司在 AI 领域的创新发展。与此同时,无问芯穹还推出了纯语言版本的模型 Megrez-3B-Instruct,以进一步丰富其产品线。无问芯穹成立于2023年5月,创始团队来自清华大学电子工程系。公司致力于打造高效的 AI 计算优化能力,以实现大模型的有效落地。其独特的解决方案包括 “端模型 + 端软件 + 端 IP” 的一体化智能系统,力求在多个芯片上实现多种大模型
在 AI 时代,大型语言模型(LLM)就像武林秘籍,其训练过程耗费巨大算力、数据,就像闭关修炼多年的武林高手。而开源模型的发布,就像高手将秘籍公之于众,但会附带一些许可证(如 Apache2.0和 LLaMA2社区许可证)来保护其知识产权(IP)。然而,江湖险恶,总有“套壳”事件发生。一些开发者声称自己训练了新的 LLM,实际上却是在其他基础模型(如 Llama-2和 MiniCPM-V)上进行包装或微调。 这就好像偷学了别人的武功,却对外宣称是自己原创的。为了防止这种情况发生,模型所有者和第三方迫
在2024年世界互联网大会乌镇峰会期间,阿里巴巴集团首席执行官吴泳铭于11月21日在互联网企业家论坛上发表了主题演讲,强调了人工智能(AI)对互联网行业的深远影响。他指出,今年互联网行业最大的变化依然是 AI 技术的迅速发展。吴泳铭表示,AI最大的价值绝不仅仅是在手机上做出一两个超级App,而是推动各行各业的生产力变革。发展AI需要建设繁荣的技术、产品和市场生态。目前,已有超过30万家企业接入阿里巴巴的通义大模型,利用 AI 技术重塑代码开发、药物研发、生产制造等多
近日,北京零一万物信息技术有限公司与华为技术有限公司在北京举行了签约仪式,正式启动基于华为昇腾硬件的原生大模型应用开发。这一合作将结合双方的技术优势,着力于人工智能在多个行业中的应用,特别是在金融、政务、制造、能源、交通和运营商等领域。此次合作的核心在于零一万物将利用华为的昇腾硬件底座、昇腾异构计算架构(CANN)、昇思 MindSpore AI 框架以及 MindIE 推理引擎,开发一系列原生大模型应用。该项目旨在构建更高效的 AI 智能体(AI-Agents),为各行业提供更加智