专访微软陶然：很多人认为有 GPU 就能做大模型，这是一个很大的误区丨科创 100 人

新浪科技

发布于AI新闻资讯 · 1 分钟阅读 · 2023年8月10号 11:11

298

微软认为每个 APP 和应用都应该被 AI 优化，在过去半年内，微软基于 AI 重写了几乎所有内部产品。大模型意味着大成本，大模型的价格永远是不可控的。大模型的成本包括硬件成本、算力成本、网络成本、算法成本等，而算力成本只是其中的一部分。

大模型效率狂飙：字节COMET技术开源，提速1.7倍

字节跳动旗下豆包大模型团队近日宣布，成功攻克混合专家模型（MoE）架构的关键瓶颈，并开源一项名为COMET的重大优化技术。该技术显著提升了大模型的训练效率，实现了高达1.7倍的效率提升，并有效降低了40%的训练成本。图源备注：图片由AI生成，图片授权服务商Midjourney据介绍，COMET技术已在字节跳动的万卡集群训练中得到实际应用，累计节省了数百万GPU小时的训练算力。与近期DeepSeek开源的DualPipe等MoE优化方案相比，COMET具有更强的兼容性和便捷性，能够像插件一样直接接入现有的MoE训

智元发布家务机器人基座大模型 GO-1，成功率大幅提升

3月10日，智元机器人正式推出其首个通用具身基座大模型 ——Genie Operator-1（简称 GO-1）。这一消息引起了广泛关注，特别是其在家庭服务机器人的潜力方面，似乎为未来的家务管理带来了新的希望。根据智元机器人的官方介绍，GO-1大模型通过学习大量人类视频，展示了其在执行多项家务任务上的出色表现，如递送水杯、制作餐点和迎接客人等。在技术性能方面，GO-1的表现相较于现有模型有显著提升，其平均成功率提高了32%。经过测试，GO-1在一些特定任务如倒水、清理桌面和补充饮料等方

华为昇腾携手阶跃星辰推出开源多模态模型，进军 AI 新领域

近日，魔乐社区（Modelers）正式上线了由阶跃星辰研发的 Step-Video 和 Step-Audio 两款开源多模态大模型。这两款模型分别用于视频生成和语音交互，旨在为开发者和企业用户提供更强大的 AI 工具。Step-Video 模型的全名为 Step-Video-T2V，这是一款参数量高达300亿的全球最大开源视频生成模型。该模型能够直接生成204帧、540P 分辨率的高质量视频，并在指令遵循、运动平滑性、物理合理性以及美感等方面，表现超越了市场上现有的顶尖开源视频模型。另一方面，Step-Audio 则是业内首款能够生成多种情

国家超算互联网平台接入阿里千问大模型提供QwQ-32B API

据报道，国家超算互联网平台宣布接入阿里巴巴的通义千问大模型，正式对外提供千问 QwQ-32B API 服务。用户在使用该服务时，能够免费获取多达100万 tokens，这无疑为广大开发者和研究人员提供了一个良好的机会。千问 QwQ-32B 是阿里通义团队最新开源的推理模型，具有出色的表现。根据多个权威评测数据，千问 QwQ-32B 的能力与「满血版」671B 的 DeepSeek-R1相当，远超 o1-mini 及其他同尺寸的 R1蒸馏模型。这一创新的发布使得千问 QwQ-32B 迅速登顶全球最大 AI 开源社区 HuggingFace 的趋势榜，成为当前

AI新闻资讯