Mooncake-Plataforma líder em fornecimento de serviços LLM

Mooncake é a plataforma de serviços Kimi, fornecida pela Moonshot AI, sendo uma plataforma líder de serviços de modelos de linguagem extensos (LLM). Ela adota uma arquitetura desacoplada centrada em KVCache, separando os clusters de pré-preenchimento (prefill) e decodificação (decoding), e aproveitando os recursos de CPU, DRAM e SSD subutilizados nos clusters de GPU para implementar o cache desacoplado do KVCache. O núcleo do Mooncake é o seu despachador central KVCache, que equilibra a maximização da taxa de transferência eficaz geral, ao mesmo tempo que garante o cumprimento dos requisitos de metas de nível de serviço (SLOs) relacionadas à latência. Ao contrário das pesquisas tradicionais, o Mooncake enfrenta cenários de sobrecarga elevada, para os quais foi desenvolvida uma estratégia de rejeição antecipada baseada em previsão. Experimentos demonstram que o Mooncake apresenta excelente desempenho em cenários de contextos longos, com aumento de 525% na taxa de transferência em alguns cenários simulados em comparação com métodos de referência, respeitando os SLOs. Em cargas de trabalho reais, a arquitetura inovadora do Mooncake permite que o Kimi processe mais de 75% das solicitações.

Notícias de IA

IA Diário

Linha do Tempo da IA

Al hardware

Casos Recentes

Coleção de Imagens

Coleção de Vídeos

Coleção de Áudios

Coleção de Conteúdo

Tutoriais Recentes

Ranking de Produtos de IA

Ranking de Crescimento de Tráfego de IA

Ranking de Queda de Tráfego de IA

Ranking Semanal de IA

Estados Unidos

China

Índia

Brasil

Geração de Imagens

Assistente Pessoal

Geração de Personagens

Geração de Vídeos

Ranking de Projetos de IA

Ranking de Crescimento de Projetos de IA

Ranking de Desenvolvedores de IA

Ranking de Organizações de IA

Deepseek

TTS

LLM

ChatGPT

Visão Geral

Mooncake

Mooncake Situação do Tráfego Mais Recente

Mooncake Tendência de Visitas

Mooncake Distribuição Geográfica das Visitas

Mooncake Fontes de Tráfego

Mooncake Alternativas

Mooncake — Plataforma líder em fornecimento de serviços LLM