LLM360:全球首个完全开源透明的大语言模型

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Qwen3是什么?阿里Qwen3是通义千问系列的最新一代开源大语言模型(LLM),于2025年4月29日正式发布。作为全球首个支持“混合推理”的模型,Qwen3包含8款不同规模的模型,涵盖稠密模型(如0.6B、4B、32B)和混合专家模型(MoE,如30B-A3B、235B-A22B),采用Apache2.0协议开源,支持免费商用。其核心目标是提供高性能、低成本的AI解决方案,同时覆盖从边缘设备到企业级服务器的全场景需求。 Qwen3的主要功能混合推理模式:支持“思考模式”与“非思考模式”无缝切换。前者适用于复杂推理(如数学、代码
中国初创公司 Moonshot AI 最近推出了一款名为 Kimi-VL 的开源模型。该模型在处理图像、文本和视频方面表现出色,以其高效的性能引起了广泛关注。Kimi-VL 最大的亮点在于其处理长文档、复杂推理和用户界面的能力。据 Moonshot AI 介绍,Kimi-VL 采用了一种专家混合架构,仅在执行特定任务时激活部分模型。尽管只有2.8亿个活跃参数,但 Kimi-VL 在多个基准测试中表现出与许多大型模型相媲美的结果,其效率远超许多同类产品。Kimi-VL 的最大上下文窗口可达128,000个标记,这使其能够处理整本书籍
4月29日,通义App与通义网页版(tongyi.com)全面上线阿里新一代通义千问开源模型Qwen3(简称千问3)。用户可以第一时间在通义App和网页版中的专属智能体“千问大模型”,以及主对话页面,体验到全球最强开源模型的顶级智能能力。据了解,千问3一经发布便登顶全球最强开源模型。本次发布的千问3开源模型包含8款不同尺寸,均为全新的“混合推理模型”,智能水平大幅提升的同时也更省算力。其中,千问3旗舰模型Qwen3-235B-A22B是一款混合专家(MoE)模型,该模型创下所有国产模型及全球开源
阿里巴巴正式推出新一代通义千问模型 Qwen3(千问3),并宣布其开源。阿里云表示,千问3是国内首个 “混合推理模型”,同时集成了 “快思考” 与 “慢思考” 的能力。相比于 DeepSeek-R1,千问3的参数量仅为其三分之一,而部署成本大幅降低,使用仅需四张 H20显卡即可实现满血版的部署。根据官方技术博客,千问3采用了混合专家(MoE)架构,拥有2350亿个参数,实际激活时仅需220亿参数。这款模型在预训练阶段使用了36TB 的数据,并通过多轮强化学习进行后训练。同时,千问3能够无缝结
开源人工智能的星空,昨夜骤然被一颗新星照亮!备受瞩目的 Step1X-Edit 图像编辑框架,已于2025年4月24日正式登陆 Hugging Face 社区,瞬间点燃了全球开发者和创意工作者的热情。这不仅仅是又一个开源工具的发布,更像是一次对现有图像编辑格局的强力挑战。据悉,Step1X-Edit 巧妙地将强大的多模态大语言模型(Qwen-VL)与先进的扩散变换器(DiT)深度融合,赋予用户通过简单的自然语言指令,即可实现令人惊叹的高精度图像编辑能力。其表现出的卓越性能,甚至敢于直接叫板像 GPT-4o 与 Gemini2Flash
据最新消息,全球首个扩散语言模型(Diffusion Language Model,DLM)ChatDLM即将开源,为全球开发者与研究者提供全新的AI工具,预计将推动生成式AI技术的进一步发展。技术亮点:高效与长上下文处理能力并存ChatDLM深度融合了块扩散(Block Diffusion)与专家混合(Mixture-of-Experts,MoE)架构,展现出卓越的性能表现。其核心技术特点包括:超高推理速度:在A100 GPU上,ChatDLM的推理速度高达2,800 tokens/秒,远超传统自回归语言模型,成为目前全球最快的语言模型之一。超长上下文窗口:支持高达131,
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Moonshot AI发布Kimi-Audio:开源音频基础模型树立新标杆Moonshot AI最近推出的Kimi-Audio是一款开源音频基础模型,旨在推动音频理解、生成和交互技术的发展。该模型基于Qwen2.5-7B架构,结合Whisper技术,支持多种音频任务,如语音识别和音频问答。凭借超过13亿小时的多样化音频数据训练,Kimi-Audio在多
4月27日,清华大学旗下的两家明星人工智能公司智谱(Z.ai)和生数科技(shengshu.com)宣布达成重大战略合作。此次合作旨在通过双方在大语言模型和多模态生成模型的技术积累与优势,共同推进国产大模型的技术创新与产业落地。
传统CRM系统因数据分散、销售人员难以管理、客户隐私数据担忧、缺乏智能分析等痛点,很难满足企业高效管理客户关系与提升业务绩效的需求。大语言模型和Agent技术的蓬勃发展,让智能CRM时代真正到来,实现从线索获取到客户转化、项目管理及财务数据处理的全流程自动化,提升企业运营效率,创造增量价值。通付盾CRM智能体“招财猫”—————————————————AI Agent助力企业销售智能化通付盾推出CRM智能体(CRM Agent),代号“招财猫(CAT)”,助力企业从销售线索到客户成
近日,Moonshot AI正式宣布推出Kimi-Audio,一款全新的开源音频基础模型,旨在推动音频理解、生成和交互领域的技术进步。这一发布引发了全球AI社区的广泛关注,被认为是多模态AI发展的重要里程碑。以下是对Kimi-Audio核心特性、性能表现及行业影响的全面报道。突破性特性:全能音频处理能力Kimi-Audio-7B-Instruct基于Qwen2.5-7B架构,并结合Whisper技术,展现了强大的多功能性。该模型支持多种音频相关任务,包括但不限于:语音识别(ASR)、音频问答(AQA)、音频字幕(AAC)、语音情感识别(SER)、声音事件