元象发布MoE开源大模型XVERSE-MoE-A36B 激活参数达36B

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年9月13号 11:08

115

深圳元象信息科技有限公司近日宣布，公司已成功发布中国最大的Mixture of Experts（MoE）开源大模型——XVERSE-MoE-A36B。这款模型的发布标志着中国在AI领域的一大进步，将国产开源技术提升至国际领先水平。

XVERSE-MoE-A36B模型拥有255B的总参数和36B的激活参数，其性能可与超过100B参数的大模型相媲美，实现了跨级的性能跃升。该模型在训练时间上减少了30%，推理性能提升了100%，大幅降低了每token的成本，使得AI应用的低成本部署成为可能。

微信截图_20240913110614.png

元象XVERSE的"高性能全家桶"系列模型已全面开源，无条件免费供商业使用，这为众多中小企业、研究者和开发者提供了更多的选择机会。MoE架构通过组合多个细分领域的专家模型，打破了传统扩展定律的局限，在扩大模型规模的同时，保持了模型性能的最大化，并降低了训练和推理的计算成本。

在多个权威评测中，元象MoE的效果显著超越了多个同类模型，包括国内千亿MoE模型Skywork-MoE、传统MoE霸主Mixtral-8x22B，以及3140亿参数的MoE开源模型Grok-1-A86B等。

免费下载大模型

Hugging Face:https://huggingface.co/xverse/XVERSE-MoE-A36B
魔搭:https://modelscope.cn/models/xverse/XVERSE-MoE-A36B
Github:https://github.com/xverse-ai/XVERSE-MoE-A36B
问询:opensource@xverse.cn
官网:chat.xverse.cn

扣子Coze宣布独家支持 DeepSeek Function Calling 工具调用能力

新一代AI应用搭建平台——扣子（Coze），宣布正式推出对DeepSeek Function Calling工具调用能力的独家支持。扣子平台此次更新的核心亮点在于其对DeepSeek模型的深度整合。用户不仅能够免费体验DeepSeek的R1和V3模型，还能通过扣子平台实时查看模型的思维链内容。这一功能的推出，使得开发者能够在调试区、扣子商店等场景中直观地观察模型的推理过程，并通过API获取思维链字段的具体内容，从而更好地理解和优化模型的表现。

xAI的Grok应用登顶App Store生产力榜首马斯克预告即将推出新功能

旧金山， 2025 年 2 月 19 日讯 —— xAI和特斯拉CEO埃隆·马斯克近日宣布，其公司开发的Grok AI应用已跃居App Store生产力类别免费应用排行榜首位。马斯克在社交媒体平台上分享的截图显示，Grok超越了多款知名应用，包括OpenAI的ChatGPT（第二）、Google Gemini（第三）、Gmail（第四）、Microsoft Authenticator（第五）、DeepSeek AI Assistant（第六）以及Google Docs（第七）。"这还没有包含语音模式和即将在未来几天推出的众多其他功能，"马斯克在其推文中表示。这一暗示表明，尽管Grok已在当前配置下取得了显

EnCharge AI 获超 1 亿美元融资加速模拟芯片在人工智能领域的应用

美国半导体初创公司 EnCharge AI 最近宣布完成了一轮超过1亿美元的 B 轮融资，此次融资由老虎全球（Tiger Global）领投。该公司专注于开发用于人工智能(AI)应用的模拟内存芯片，致力于提高 AI 处理的速度并降低成本。图源备注：图片由AI生成，图片授权服务商MidjourneyEnCharge AI 成立于普林斯顿大学，致力于为各类设备，包括笔记本电脑、台式机、手机和可穿戴设备，提供新型的模拟内存芯片。公司声称，这些新型芯片在运行工作负载时能耗比市场上其他芯片低20倍，并预计在今年晚些时候推出

字节跳动豆包UltraMem架构将大模型推理成本降低83%

字节跳动豆包大模型团队今日宣布，成功研发出全新稀疏模型架构UltraMem，该架构有效解决了MoE（混合专家）模型推理时的高额访存问题，推理速度较MoE提升2-6倍，推理成本最高可降低83%。这一突破性进展为大模型的高效推理开辟了新路径。UltraMem架构在保证模型效果的前提下，成功解决了MoE架构推理时的访存瓶颈。实验结果表明，在参数和激活条件相同的情况下，UltraMem不仅模型效果优于MoE，更将推理速度提升了2-6倍。此外，在常见batch size规模下，UltraMem的访存成本几乎与同计算量的Dense

AI新闻资讯

元象发布MoE开源大模型XVERSE-MoE-A36B 激活参数达36B

AIbase基地

相关AI新闻推荐

扣子Coze宣布独家支持 DeepSeek Function Calling 工具调用能力

xAI的Grok应用登顶App Store生产力榜首 马斯克预告即将推出新功能

EnCharge AI 获超 1 亿美元融资 加速模拟芯片在人工智能领域的应用

字节跳动豆包UltraMem架构将大模型推理成本降低83%

xAI的Grok应用登顶App Store生产力榜首马斯克预告即将推出新功能

EnCharge AI 获超 1 亿美元融资加速模拟芯片在人工智能领域的应用