Kimi联手清华开源大模型推理架构Mooncake 提升AI推理效率

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年11月28号 11:03

223

在人工智能迅速发展的时代，大型模型的智能化水平不断提升，但随之而来的推理系统效率挑战也越来越明显。如何应对高推理负载、降低推理成本、缩短响应时间，已成为业界共同面对的重要问题。

Kimi 公司联合清华大学的 MADSys 实验室，推出了基于 KVCache 的 Mooncake 推理系统设计方案，该方案于2024年6月正式发布。

Mooncake 推理系统通过创新的 PD 分离架构和以存换算为中心的理念，显著提升了推理的吞吐能力，吸引了广泛的行业关注。为了进一步推动这一技术框架的应用与普及，Kimi 与清华大学 MADSys 实验室联合多家企业，如9#AISoft、阿里云、华为存储等，推出了开源项目 Mooncake。11月28日，Mooncake 的技术框架在 GitHub 平台正式上线。

Mooncake 开源项目围绕超大规模 KVCache 缓存池展开，致力于通过分阶段的方式逐步开源高性能的 KVCache 多级缓存 Mooncake Store。同时，该项目将兼容多种推理引擎和底层存储、传输资源。

目前，传输引擎 Transfer Engine 的部分已经在 GitHub 上全球开源。Mooncake 项目的终极目标是为大模型时代构建一个新型高性能内存语义存储的标准接口，并提供相关的参考实现方案。

Kimi 公司的工程副总裁许欣然表示:“通过与清华大学 MADSys 实验室的紧密合作，我们共同打造了分离式的大模型推理架构 Mooncake，实现了推理资源的极致优化。

Mooncake 不仅提升了用户体验，还降低了成本，为处理长文本和高并发需求提供了有效解决方案。” 他期待更多企业和研究机构加入 Mooncake 项目，共同探索更高效的模型推理系统架构，让 AI 助手等基于大模型技术的产品能够惠及更广泛的人群。

项目入口:https://github.com/kvcache-ai/Mooncake

划重点:
🌟 Kimi 与清华大学联合发布 Mooncake 推理系统，提升 AI 推理效率。
🔧 Mooncake 项目已在 GitHub 上开源，旨在构建高性能内存语义存储标准接口。
🤝 期待更多企业和研究机构参与，共同推动 AI 技术进步。

Wayve推完整世界模型GAIA-2：支持同时生成5个视角的视频，可模拟高风险场景

Wayve公司近日隆重推出了其最新的视频生成世界模型——GAIA-2。这一突破性的技术是其上一代模型GAIA-1的重大升级，旨在通过生成高度多样化和可控的驾驶场景视频，极大地推动辅助和自动驾驶系统的安全性发展. GAIA-2的发布标志着Wayve在利用生成式人工智能技术赋能更安全、更智能的出行方面迈出了坚实的一步。GAIA-1的飞跃:场景多样性全面提升与GAIA-1相比，GAIA-2最显著的提升在于其生成视频场景的丰富性和真实感. 为了训练和验证自动驾驶系统在各种复杂环境下的性能，需要接触到尽可能

谷歌发布全新AI模型Gemini 2.5 Pro 免费开放使用

谷歌宣布其最新的人工智能旗舰模型 ——Gemini2.5Pro将免费向所有 Gemini 应用用户开放。这一消息意味着，早前仅限于付费.99美元每月的 Gemini Advanced 用户才能体验的高端功能，现在也能够让更多用户共享。Gemini2.5Pro 被谷歌称为迄今 “最智能的 AI 模型”，在推理能力上有了显著提升。新模型不仅支持多种功能，包括应用和浏览器扩展，还允许文件上传，并能够与谷歌的协作工具 Canvas 无缝集成。这些更新旨在为用户提供更加流畅的体验，并让他们能够更轻松地选择和记住当前使用的 Gemini 模

OpenAI 400亿融资遭微软围剿，若年底前未成功转型则融资砍半200亿

OpenAI 目前正努力推进一轮高达400亿美元的融资，这笔巨额资金由日本软银领投，并设定了一个严格的条件:OpenAI 必须在2025年年底前完成向盈利性公司的转型。如果转型成功，公司的估值将有望飙升至3000亿美元，成为人工智能领域的 “独角兽之王”。然而，这笔资金并非唾手可得。如果 OpenAI 未能按期实现转型，融资额度将缩水至200亿美元，这一条件无疑为公司的改组之路增添了巨大的压力。初步的100亿美元融资已经确定，但后续的300亿美元则完全取决于公司的表现。软银希望通过这一举

OpenAI 视频生成工具 Sora 遭曝光：种族与性别偏见问题凸显

近年来，生成式人工智能（AI）技术的迅猛发展改变了数字内容创作的面貌，但偏见问题始终伴随其中。最近，《连线》杂志对 OpenAI 旗下的视频生成工具 Sora 进行了深入调查，结果发现该工具在生成视频时常常会强化种族、性别和能力方面的刻板印象，甚至有时忽视了对某些群体的表现。图源备注：图片由AI生成，图片授权服务商Midjourney在调查中，研究人员给 Sora 提供了25个基本的提示，例如 “一个人走路” 或 “飞行员” 等职位名称，同时也包含一些身份特征的描述，比如 “残疾人”