ムーンケーキ-最先端の大規模言語モデル（LLM）サービス提供プラットフォーム

ムーンケーキは、Moonshot AIが提供するKimiのサービスプラットフォームであり、最先端の大規模言語モデル（LLM）サービスです。KVキャッシュを中核としたデカップリングアーキテクチャを採用し、プリフィル（事前準備）とデコーディング（復号）のクラスタを分離することで、GPUクラスタ内で十分に活用されていないCPU、DRAM、SSDリソースを利用したKVキャッシュのデカップリングキャッシュを実現しています。ムーンケーキの中核はKVキャッシュ中央スケジューラであり、遅延関連のサービスレベル目標（SLO）要件を満たしつつ、全体的な有効スループットの最大化を両立します。従来の研究とは異なり、ムーンケーキは高度な過負荷のシナリオに対処するため、予測に基づいた早期拒否戦略を開発しました。実験により、ムーンケーキは長いコンテキストのシナリオで優れたパフォーマンスを示し、ベースライン手法と比較して、一部のシミュレーションシナリオではスループットが525％向上し、同時にSLOも遵守することが明らかになりました。実際のワークロードでは、ムーンケーキの革新的なアーキテクチャにより、Kimiは75％を超えるリクエストを処理できます。

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

ムーンケーキ

ムーンケーキ 最新のトラフィック状況

ムーンケーキ 訪問数の傾向

ムーンケーキ 訪問地理的分布

ムーンケーキ トラフィックソース

ムーンケーキ 代替品

ムーンケーキ — 最先端の大規模言語モデル（LLM）サービス提供プラットフォーム

ムーンケーキ最新のトラフィック状況

ムーンケーキ訪問数の傾向

ムーンケーキ訪問地理的分布

ムーンケーキトラフィックソース

ムーンケーキ代替品