Mooncake

Plateforme de services LLM de pointe

Produit OrdinaireAutreServices LLMArchitecture découplée

Mooncake est la plateforme de services de Kimi, fournie par Moonshot AI. Il s'agit d'une plateforme de services de pointe pour les grands modèles de langage (LLM). Elle adopte une architecture découplée centrée sur KVCache, en séparant les grappes de préremplissage et de décodage, et en utilisant les ressources CPU, DRAM et SSD sous-utilisées des grappes GPU pour implémenter le cache découplé KVCache. Au cœur de Mooncake se trouve son ordonnanceur central KVCache, qui équilibre la maximisation du débit efficace global tout en garantissant le respect des objectifs de niveau de service (SLO) liés à la latence. Contrairement aux recherches traditionnelles, Mooncake est confronté à des scénarios de surcharge extrême, ce qui a conduit au développement d'une stratégie de rejet précoce basée sur la prédiction. Les expériences montrent que Mooncake excelle dans les scénarios à long contexte, avec une augmentation du débit pouvant atteindre 525 % dans certains scénarios simulés par rapport aux méthodes de référence, tout en respectant les SLO. En charge de travail réelle, l'architecture innovante de Mooncake permet à Kimi de traiter plus de 75 % des requêtes.

Best AI Websites & Tools

Mooncake

Mooncake Dernière situation du trafic

Mooncake Tendance des visites

Mooncake Distribution géographique des visites

Mooncake Sources de trafic

Mooncake Alternatives

Mooncake — Plateforme de services LLM de pointe

Instella — Instella est un modèle linguistique open source haute performance développé par AMD, conçu pour accélérer le développement des modèles linguistiques open source.

smallpond — Un framework de traitement de données léger basé sur DuckDB et 3FS

FireRedASR-AED-L — Modèle de reconnaissance automatique de la parole (RAP) industriel open source, prenant en charge le mandarin, les dialectes chinois et l'anglais, aux performances exceptionnelles.

DeepClaude — API et interface de chat unifiés combinant les capacités de raisonnement de DeepSeek R1 et la créativité et la génération de code de Claude.

DeepSeek-R1-Distill-Qwen-32B — DeepSeek-R1-Distill-Qwen-32B est un modèle linguistique open source haute performance, adapté à diverses tâches de génération de texte.

YuLan-Mini — Un modèle linguistique léger et performant de 240 millions de paramètres

RWKV-6 Finch 7B World 3 — Modèle d'IA open source, doté de 7 milliards de paramètres et entraîné sur 3,1 billions de jetons multilingues.

Llama-3.1-Tulu-3-8B-RM — Modèle de suivi d'instructions avancé, offrant un guide complet des techniques d'entraînement postérieur.

Google Gemma 2 — Modèle IA open source de nouvelle génération, aux performances exceptionnelles.

Ami local — Serveur web open source stable et fiable

l1m — Une API proxy utilisée pour extraire des données structurées à partir de texte et d'images, implémentée à l'aide de LLM.

Proxy Lite — Proxy Lite est un modèle de langage visuel (VLM) open source de 3 milliards de paramètres, axé sur les tâches d'automatisation Web.

AoT — Atom of Thoughts (AoT) est un framework permettant d'améliorer les performances d'inférence des grands modèles de langage.

OpenManus — OpenManus est un projet d'agent intelligent open source utilisable sans code d'invitation.

CocoIndex — CocoIndex est un moteur d'indexation de données open source, prenant en charge la logique de conversion personnalisée et les mises à jour incrémentielles.

NeoBase — NeoBase est un assistant de base de données IA open source qui vous permet d'interagir avec votre base de données en langage naturel.

Aya Vision 32B — Aya Vision 32B est un modèle de langage visuel multilingue adapté à de multiples usages, tels que l'OCR, la description d'images et le raisonnement visuel.

Aya Vision 8B — Modèle de langage visuel multilingue à 800 millions de paramètres, prenant en charge l'OCR, la description d'images et le raisonnement visuel.

Scira — Scira est un moteur de recherche minimaliste basé sur l'IA, qui aide les utilisateurs à trouver des informations sur Internet.

Framework Desktop — Framework Desktop est un mini-ordinateur de bureau hautes performances compatible avec les processeurs AMD Ryzen™ AI Max 300 Series, offrant des performances exceptionnelles pour l'IA et les jeux.

MindMapper — Une application web qui génère des cartes mentales interactives à partir d'une URL, d'une vidéo YouTube ou d'une invite textuelle.

Modèles de traduction Firefox — Modèle de traduction automatique neuronale accéléré par CPU, optimisé pour la fonction de traduction du navigateur Firefox.

ExplainGitHub — Un outil de navigation de référentiels GitHub moderne, offrant une navigation de code intelligente et des performances optimisées.

Vibe Coder — Vibe Coder est une extension VS Code open source permettant d'explorer l'expérience de programmation IA basée sur la voix.

GibberLink — Deux agents IA conversationnels, après s'être mutuellement identifiés comme IA, basculent vers un protocole de communication de niveau sonore.

Migician — Migician est un grand modèle linguistique multimodale axé sur la localisation multi-images, capable de réaliser une localisation précise multi-images de forme libre.

PhotoDoodle — PhotoDoodle est une implémentation de code d'édition d'images artistiques basée sur l'apprentissage à partir de quelques exemples de paires de données.

llm-commit — Un plugin pour générer des messages de commit Git avec un LLM

Ant Design X Vue — Ant Design X Vue est une solution d'interface utilisateur pour l'IA basée sur Vue, visant à créer une expérience utilisateur exceptionnelle pour les produits d'IA.