零一万物公司宣布开源Yi-9B模型,该模型是Yi系列中代码和数学能力最强的,实际参数为8.8B,默认上下文长度为4K tokens。Yi-9B在综合能力、代码能力、数学能力方面均表现优异,超越了其他开源模型。同时,Yi-9B可以轻松部署在消费级显卡上,使用成本较低,开发者友好。公司由李开复创新工场董事长兼CEO创办,之前已推出Yi-34B和Yi-6B两个开源大模型,对学术研究完全开放,同步免费商用申请。
相关AI新闻推荐

暗月之面发布开源模型 Kimi-VL, 28 亿个参数即可处理文本、图像和视频
中国初创公司 Moonshot AI 最近推出了一款名为 Kimi-VL 的开源模型。该模型在处理图像、文本和视频方面表现出色,以其高效的性能引起了广泛关注。Kimi-VL 最大的亮点在于其处理长文档、复杂推理和用户界面的能力。据 Moonshot AI 介绍,Kimi-VL 采用了一种专家混合架构,仅在执行特定任务时激活部分模型。尽管只有2.8亿个活跃参数,但 Kimi-VL 在多个基准测试中表现出与许多大型模型相媲美的结果,其效率远超许多同类产品。Kimi-VL 的最大上下文窗口可达128,000个标记,这使其能够处理整本书籍

通义App全面上线千问3 第一时间体验全球最强开源模型
4月29日,通义App与通义网页版(tongyi.com)全面上线阿里新一代通义千问开源模型Qwen3(简称千问3)。用户可以第一时间在通义App和网页版中的专属智能体“千问大模型”,以及主对话页面,体验到全球最强开源模型的顶级智能能力。据了解,千问3一经发布便登顶全球最强开源模型。本次发布的千问3开源模型包含8款不同尺寸,均为全新的“混合推理模型”,智能水平大幅提升的同时也更省算力。其中,千问3旗舰模型Qwen3-235B-A22B是一款混合专家(MoE)模型,该模型创下所有国产模型及全球开源

微软全新开源模型 MAI-DS-R1:敏感话题响应提升,安全风险降低
微软在其官网上正式开源了 DeepSeek-R1的魔改版 ——MAI-DS-R1。这一新模型在保留原有推理性能的基础上,进行了显著的增强,尤其在对敏感话题的响应能力上取得了巨大的突破。MAI-DS-R1的响应能力达到了99.3%,是原版 R1的两倍多。这一进步将对政治学、社会问题以及伦理道德的研究提供极大的支持。尽管其响应了更多的敏感话题,但在安全风险方面,MAI-DS-R1的有害内容降低了50%,展现出良好的安全控制能力。因此,渴望体验 “放飞自我” 版的用户可以尝试这一模型,探索新的可能性。在模

智谱Z基金出资3亿支持全球开源社区 北京追加投资2亿元
北京市人工智能产业投资基金宣布在去年已有投资基础上,继续追加投资智谱(Z.ai)2亿元人民币,支持智谱的开源模型研发与开源社区生态建设。智谱是基金成立以来投资的第一家 AI 大模型企业,也是目前成长最快的企业。智谱在包括文本、推理、语音、图像、视频、代码等在内的模型能力上有全面积累,商业化布局完善,拥有超过百万规模的开发者社区和企业用户。

智谱华章获北京AI产业基金2亿元追加投资,开源模型战略获官方认可
北京市人工智能产业投资基金近日宣布,向北京智谱华章科技股份有限公司(简称"智谱")追加投资2亿元人民币。据基金方面透露,智谱是该基金成立以来投资的第一家AI大模型企业,也是目前成长最快的企业之一。智谱在文本、推理、语音、图像、视频和代码等领域的模型能力建设方面积累深厚,同时拥有完善的商业化布局,已经建立了超过百万规模的开发者社区和企业用户基础。此次投资旨在进一步推动智谱在开源模型和算法创新方面的能力建设。4月14日,智谱开源了32B/9B系列GLM模型

智谱AI启用全新域名Z.ai 并开源 32B/9B 系列 GLM 模型
智谱技术团队宣布开源32B 和9B 系列的 GLM(General Language Model)模型,并正式上线了全新的交互体验平台 Z.ai。这一系列模型包括基座模型、推理模型和沉思模型,均遵循宽松的 MIT 许可协议,为开发者提供了极大的使用和开发自由度,可免费用于商业用途和自由分发。

AI代码模型开源潮来袭:Cogito v1 Preview震撼亮相,70B性能碾压Llama 4
近日,AI代码生成领域掀起了一波开源热潮,多款重量级模型接连亮相,其中Deep Cogito推出的Cogito v1Preview系列尤为引人注目。据AIbase了解,这一全新开源模型家族涵盖3B、8B、14B、32B和70B等多种规格,不仅在性能上全面超越同级别竞争者,其70B版本更是力压Meta最新发布的Llama4109B MoE模型,成为业界热议的焦点。这一系列模型的发布,不仅为开发者提供了强大的编程利器,也预示着AI技术在编码领域的全新突破。多规格覆盖,性能领跑行业Cogito v1Preview系列提供了从3亿到70亿参数的多种选择,满

英伟达发布Llama 3.1 Nemotron Ultra 253B:性能超群的技术新标杆
2025年4月8日,英伟达推出Llama3.1Nemotron Ultra253B,这一基于Llama-3.1-405B优化的开源模型以253亿参数超越Meta的Llama4Behemoth和Maverick,成为AI领域焦点。该模型在GPQA-Diamond、AIME2024/25及LiveCodeBench等测试中表现卓越,推理吞吐量达DeepSeek R1的四倍。通过优化训练和算法,英伟达证明高效设计可让小模型媲美巨型对手。Llama3.1Nemotron Ultra253B通过HuggingFace开放权重,并采用商业友好许可。英伟达此举不仅便利开发者,也推动了AI技术的广泛应用和生态发展。以较小参数挑战万亿级模型,该模型展现“少即是多

AI日报:阿里通义千问登顶全球开源模型榜首;MiniMax推Speech-02语音模型;ChatGPT付费用户激增至2000万
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里通义千问Qwen2.5-Omni登顶全球开源模型榜单2024年4月2日,HuggingFace发布了最新的大模型榜单,阿里巴巴的Qwen2.5-Omni凭借其卓越的性能和多模态能力,成功登顶,成为全球开源模型的领军者。尽管没有进行大规模宣传,这一举措被认为是OpenAI在推动AI教育普及方面的重要一步,受到业内人士的广泛欢迎。

阿里通义千问 Qwen2.5-Omni 登顶全球开源模型榜单
2024年4月2日,全球最大的 AI 开源社区 Hugging Face 发布了最新的大模型榜单,阿里巴巴的通义千问所推出的端到端全模态大模型 Qwen2.5-Omni 成功登顶,成为全球开源模型中的领军者。此次排名中,Qwen2.5-Omni 凭借其强大的性能和多模态能力,战胜了其他众多优秀的模型,位列榜首。紧随其后的是 DeepSeek-V3-0324和群核的 SpatialLM-Llama-1B,这两个模型在功能和应用上也颇具实力,为 AI 开发者提供了更多选择。据悉,阿里通义千问自成立以来,已经向全球开源了超过200款模型。这些模型覆盖了自然语言