Kimi Open Platform von Lunar Dark Side: 50% Preisreduktion bei Context Cache-Speicherkosten

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 2 Minuten Lesezeit · Aug 7, 2024

221

Die Kimi Open Platform unter dem Dach von Mondfinsternis kündigt an, die Kosten für die Kontext-Cache-Speicherung um 50 % zu senken. Konkret: Die Kosten für die Cache-Speicherung sinken von 10 Yuan/1M Tokens/Minute auf 5 Yuan/1M Tokens/Minute.

微信截图_20240807110150.png

Am 1. Juli kündigte die Kimi Open Platform die öffentliche Beta-Phase des Kontext-Cache (Context Caching) an.

Kontext-Caching ist eine effiziente Technik zur Datenverwaltung. Sie ermöglicht es dem System, große Datenmengen oder Informationen, die wahrscheinlich häufig abgerufen werden, im Voraus zu speichern.

Wenn Sie dieselben Informationen erneut anfordern, kann das System diese direkt und schnell aus dem Cache bereitstellen, anstatt sie neu berechnen oder aus der ursprünglichen Datenquelle abrufen zu müssen. Dies spart Zeit und Ressourcen.

Kontext-Caching eignet sich besonders für Szenarien mit häufigen Anfragen und wiederholten Verweisen auf große anfängliche Kontexte. Es kann die Kosten für Langtextmodelle deutlich senken und die Effizienz steigern!

Mondfinsternis enthüllt kimi-latest: Erleben Sie das neueste Kimi-Modell als Erster

Am 18. Februar gab die in Peking ansässige Mondfinsternis Technologie GmbH die Einführung des neuesten Modells – kimi-latest – auf der Kimi-Open-Platform bekannt. Ziel ist es, Entwicklern und Unternehmen leistungsstärkere und stabilere KI-Generierungsmöglichkeiten zu bieten. Seit dem öffentlichen Test der Kimi-Open-Platform am 31. Januar 2024 bilden die Modelle der Moonshot-v1-Serie das Kernstück des Kimi-intelligenten Assistenten.

Claude führt "Prompt-Caching" ein: Entwickler können häufig verwendete Kontexte über die API cachen

Anthropic hat für seine Claude-Serie großer Sprachmodelle die neue Funktion "Prompt-Caching" angekündigt, um die KI-Kosten für Unternehmen deutlich zu senken und die Leistung zu verbessern. Diese Funktion ermöglicht es Benutzern, bestimmte Kontextinformationen zu speichern und wiederzuverwenden, ohne zusätzliche Kosten oder Verzögerungen. In öffentlichen Tests werden die Modelle Claude 3.5 Sonnet und Claude 3 Haiku diese Funktion nutzen, wobei eine Kostenreduktion von bis zu 90 % und in einigen Szenarien eine Verdoppelung der Antwortgeschwindigkeit erwartet wird. Diese Funktion ist besonders nützlich für Anwendungen, die...

KI-Nachrichten und -Informationen

Kimi Open Platform von Lunar Dark Side: 50% Preisreduktion bei Context Cache-Speicherkosten

AIbase基地

Empfohlene verwandte KI-Nachrichten

Mondfinsternis enthüllt kimi-latest: Erleben Sie das neueste Kimi-Modell als Erster

Claude führt "Prompt-Caching" ein: Entwickler können häufig verwendete Kontexte über die API cachen