Mooncake

领先的LLM服务提供平台

普通产品其他LLM服务解耦架构

Mooncake是Kimi的服务平台，由Moonshot AI提供，是一个领先的大型语言模型(LLM)服务。它采用了以KVCache为中心的解耦架构，通过分离预填充(prefill)和解码(decoding)集群，以及利用GPU集群中未充分利用的CPU、DRAM和SSD资源来实现KVCache的解耦缓存。Mooncake的核心是其KVCache中心调度器，它在确保满足延迟相关的服务级别目标(SLOs)要求的同时，平衡最大化整体有效吞吐量。与传统研究不同，Mooncake面对的是高度过载的场景，为此开发了基于预测的早期拒绝策略。实验表明，Mooncake在长上下文场景中表现出色，与基线方法相比，在某些模拟场景中吞吐量可提高525%，同时遵守SLOs。在实际工作负载下，Mooncake的创新架构使Kimi能够处理75%以上的请求。

Best AI Websites & Tools

Mooncake

Mooncake 最新流量情况

Mooncake 访问量趋势

Mooncake 访问地理位置分布

Mooncake 流量来源

Mooncake 替代品

FireRedASR-AED-L — 开源工业级自动语音识别模型，支持普通话、方言和英语，性能卓越。

DeepClaude — 结合DeepSeek R1推理能力和Claude创造力及代码生成能力的统一API和聊天界面。

DeepSeek-R1-Distill-Qwen-32B — DeepSeek-R1-Distill-Qwen-32B 是一款高性能的开源语言模型，适用于多种文本生成任务。

YuLan-Mini — 一款高效率的2.4亿参数轻量级语言模型

RWKV-6 Finch 7B World 3 — 开源AI模型，具有7B参数和3.1T训练令牌

Llama-3.1-Tulu-3-8B-RM — 先进的指令遵循模型，提供全面后训练技术指南。

Google Gemma 2 — 下一代开源AI模型，性能卓越。

JetMoE-8B — 以低成本实现高性能的大型语言模型

Local Friend — 稳定可靠的开源Web服务器

Cline.bot — Cline 是一个为 VSCode 提供的协作式 AI 编程伙伴，助力开发者高效开发。

The Ultra-Scale Playbook — 一个专注于超大规模系统设计和优化的工具，提供高效解决方案。

Crawl4LLM — 一个用于LLM预训练的高效网络爬虫工具，专注于高效爬取高质量网页数据。

PaliGemma 2 mix — PaliGemma 2 mix 是一款多功能的视觉语言模型，适用于多种任务和领域。

SkyReels-V1-Hunyuan-I2V — SkyReels V1 是一个开源的人类中心视频基础模型，专注于高质量影视级视频生成。

Goedel-Prover — Goedel-Prover 是一款开源的自动化定理证明模型，专注于数学问题的形式化证明。

Hacker News 每日播报 — 一个基于 AI 的 Hacker News 中文播客项目，每天自动抓取 Hacker News 热门文章并生成中文总结。

Prototype — 一个快速启动带有OpenAI集成的Django项目的模板。

OmniParser-v2.0 — OmniParser 是一款通用屏幕解析工具，可将 UI 截图转换为结构化格式，提升基于 LLM 的 UI 代理性能。

Meetily — 隐私优先的AI会议助手，自动记录会议笔记，提升会议效率。

OpenThinker-32B — OpenThinker-32B 是一款强大的开源推理模型，专为提升开放数据推理能力而设计。

Next.js Chatbot Template — 一个开源的AI聊天机器人模板，使用Next.js和Vercel的AI SDK构建。

OLMoE app — Ai2 OLMoE 是一款可在 iOS 设备上运行的开源语言模型应用

Magic 1-For-1 — Magic 1-For-1 是一个高效的图像到视频生成模型，可在一分钟内生成一分钟的视频。

Xyne — Xyne 是一款开源的、以 AI 为先的搜索与答案引擎，专为工作场景设计。

Huginn-0125 — Huginn-0125是一个35亿参数的潜变量循环深度模型，擅长推理和代码生成。

Gen AI Toolbox for Databases — Gen AI Toolbox for Databases 是一个开源服务器，用于简化与数据库交互的 Gen AI 工具的开发。

On-device Sora — On-device Sora 是一个基于扩散模型的移动设备端文本到视频生成项目。

FireRedASR — 开源的工业级普通话自动语音识别模型，支持多种应用场景。

InspireMusic — 基于 PyTorch 的音乐、歌曲和音频生成工具包，支持高质量音频生成