微软认为每个 APP 和应用都应该被 AI 优化,在过去半年内,微软基于 AI 重写了几乎所有内部产品。大模型意味着大成本,大模型的价格永远是不可控的。大模型的成本包括硬件成本、算力成本、网络成本、算法成本等,而算力成本只是其中的一部分。
字节跳动旗下豆包大模型团队近日宣布,成功攻克混合专家模型(MoE)架构的关键瓶颈,并开源一项名为COMET的重大优化技术。该技术显著提升了大模型的训练效率,实现了高达1.7倍的效率提升,并有效降低了40%的训练成本。图源备注:图片由AI生成,图片授权服务商Midjourney据介绍,COMET技术已在字节跳动的万卡集群训练中得到实际应用,累计节省了数百万GPU小时的训练算力。与近期DeepSeek开源的DualPipe等MoE优化方案相比,COMET具有更强的兼容性和便捷性,能够像插件一样直接接入现有的MoE训
3月10日,智元机器人正式推出其首个通用具身基座大模型 ——Genie Operator-1(简称 GO-1)。这一消息引起了广泛关注,特别是其在家庭服务机器人的潜力方面,似乎为未来的家务管理带来了新的希望。根据智元机器人的官方介绍,GO-1大模型通过学习大量人类视频,展示了其在执行多项家务任务上的出色表现,如递送水杯、制作餐点和迎接客人等。在技术性能方面,GO-1的表现相较于现有模型有显著提升,其平均成功率提高了32%。经过测试,GO-1在一些特定任务如倒水、清理桌面和补充饮料等方
近日,魔乐社区(Modelers)正式上线了由阶跃星辰研发的 Step-Video 和 Step-Audio 两款开源多模态大模型。这两款模型分别用于视频生成和语音交互,旨在为开发者和企业用户提供更强大的 AI 工具。Step-Video 模型的全名为 Step-Video-T2V,这是一款参数量高达300亿的全球最大开源视频生成模型。该模型能够直接生成204帧、540P 分辨率的高质量视频,并在指令遵循、运动平滑性、物理合理性以及美感等方面,表现超越了市场上现有的顶尖开源视频模型。另一方面,Step-Audio 则是业内首款能够生成多种情
据报道,国家超算互联网平台宣布接入阿里巴巴的通义千问大模型,正式对外提供千问 QwQ-32B API 服务。用户在使用该服务时,能够免费获取多达100万 tokens,这无疑为广大开发者和研究人员提供了一个良好的机会。千问 QwQ-32B 是阿里通义团队最新开源的推理模型,具有出色的表现。根据多个权威评测数据,千问 QwQ-32B 的能力与「满血版」671B 的 DeepSeek-R1相当,远超 o1-mini 及其他同尺寸的 R1蒸馏模型。这一创新的发布使得千问 QwQ-32B 迅速登顶全球最大 AI 开源社区 HuggingFace 的趋势榜,成为当前