de
KI-Produkt-Charts
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
Startseite
KI-Nachrichten
KI-Tagesbericht
Monetarisierungsanleitung
KI-Tutorials
KI-Tool-Navigation
KI-Produktbibliothek
de
KI-Produkt-Charts
Suchen Sie nach globalen KI-Produktdynamiken
Suchen Sie nach globalen KI-Informationen und entdecken Sie neue KI-Möglichkeiten
Nachrichten und Informationen
Produktanwendungen
Monetarisierungsfälle
KI-Tutorials
Typ :
Nachrichten und Informationen
Produktanwendungen
Monetarisierungsfälle
KI-Tutorials
2024-11-28 11:04:56
.
AIbase
.
13.6k
Mooncake: Open-Source Inferenzarchitektur für große Sprachmodelle, gemeinsam entwickelt von Kimi und der Tsinghua Universität
Das Unternehmen Yue Zhi Anmian Keji und das MADSys-Labor der Tsinghua-Universität haben gemeinsam ein Open-Source-Projekt namens Mooncake veröffentlicht, das auf den Aufbau einer auf KVCache basierenden Inferenzarchitektur für große Sprachmodelle abzielt. Im Juni 2024 veröffentlichten beide Seiten gemeinsam den Entwurf des Mooncake-Inferenzsystems für die Kimi-Grundlage. Dieses Design basiert auf der Trennung von Parameter- und Datenverarbeitung und einer Speicher-Rechen-Architektur, wodurch der Durchsatz der Inferenz deutlich verbessert wird und es in der Branche große Aufmerksamkeit erlangte.
2024-11-28 11:03:24
.
AIbase
.
13.6k
Kimi und Tsinghua University veröffentlichen gemeinsam Mooncake, eine Open-Source-Inferenzarchitektur für große Sprachmodelle zur Steigerung der KI-Inferenzeffizienz
Im Zeitalter des rasanten Fortschritts in der Künstlichen Intelligenz steigt das Intelligenzlevel großer Modelle stetig an, doch gleichzeitig werden die Herausforderungen hinsichtlich der Effizienz von Inferenzsystemen immer größer. Die Bewältigung hoher Inferenzlasten, die Senkung der Inferenzkosten und die Verkürzung der Antwortzeiten stellen die Branche vor große Herausforderungen. Kimi in Zusammenarbeit mit dem MADSys-Labor der Tsinghua-Universität hat Mooncake vorgestellt, ein auf KVCache basierendes Design für Inferenzsysteme, das im Juni 2024 offiziell veröffentlicht wurde. Das Mooncake-Inferenzsystem...