零一万物公司宣布开源Yi-9B模型,该模型是Yi系列中代码和数学能力最强的,实际参数为8.8B,默认上下文长度为4K tokens。Yi-9B在综合能力、代码能力、数学能力方面均表现优异,超越了其他开源模型。同时,Yi-9B可以轻松部署在消费级显卡上,使用成本较低,开发者友好。公司由李开复创新工场董事长兼CEO创办,之前已推出Yi-34B和Yi-6B两个开源大模型,对学术研究完全开放,同步免费商用申请。
零一万物公司宣布开源Yi-9B模型,该模型是Yi系列中代码和数学能力最强的,实际参数为8.8B,默认上下文长度为4K tokens。Yi-9B在综合能力、代码能力、数学能力方面均表现优异,超越了其他开源模型。同时,Yi-9B可以轻松部署在消费级显卡上,使用成本较低,开发者友好。公司由李开复创新工场董事长兼CEO创办,之前已推出Yi-34B和Yi-6B两个开源大模型,对学术研究完全开放,同步免费商用申请。
在过去的一个月里,全球大模型市场因 DeepSeek 的发布而陷入了动荡,各大公司纷纷被问及对这一新兴力量的看法与应对策略。在国内市场上,已经成为独角兽的六家大模型创业公司 —— 零一万物、百川智能、阶跃星辰、智谱华章、月之暗面及 MiniMax,面临着严峻挑战,但各自的应对策略显示出不同的方向。首先,零一万物的创始人李开复早前就表示,他们不再追求超级大模型的训练,而是专注于轻量化模型的开发。2月14日,零一万物与苏州高新区联合成立产业大模型基地,聚焦于制造、
继 DeepSeek R1之后,阿里云通义千问团队刚刚宣布推出其最新的开源模型 Qwen2.5-1M,再次引发业界关注。此次发布的 Qwen2.5-1M 系列包含两个开源模型:Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M。这是通义千问首次推出能够原生支持百万Token上下文长度的模型,并在推理速度上实现了显著提升。Qwen2.5-1M 的核心亮点在于其原生支持百万 Token 的超长上下文处理能力。这使得模型能够轻松应对书籍、长篇报告、法律文件等超长文档,无需进行繁琐的分割处理。同时,该模型还支持更长时间、更深入的对话
据晚点 Auto 报道称,比亚迪在人工智能领域的研发步伐加快,零一万物的前首席技术专家聂鹏程已于2024年11月加入比亚迪的先进技术研发中心。他将主要负责人工智能超算相关的工作,并有可能参与 AI 应用的开发。聂鹏程在 AI 计算领域拥有近12年的丰富经验,这为比亚迪的技术进步注入了新活力。为了加快技术的研发速度,比亚迪从大型模型公司中引进了具备成熟经验的人才。这一决策反映了比亚迪在智能化技术方面的野心,尤其是在汽车与人工智能结合的领域。聂鹏程在加入比亚迪之前
2025年1月7日,北京零一万物科技有限公司针对近期网上关于“阿里收购零一万物”的传闻进行了辟谣。公司明确表示,这些传言是不实的,并对相关不实言论予以否认。零一万物强调,公司与阿里云的合作是基于双方在技术、算力、业务和人才等方面的深度共建,而非收购关系。