Plataforma Aberta Kimi da Lua Escura: Preço do Armazenamento em Cache de Contexto Reduzido em 50%

AIbase基地

Publicado emNotícias e Informações de IA · 2 minutos de leitura · Aug 7, 2024

220

A plataforma aberta Kimi, da empresa 月之暗面, anunciou uma redução de 50% no custo de armazenamento em cache de contexto. Especificamente: o custo de armazenamento em cache caiu de 10 yuans/1M tokens/min para 5 yuans/1M tokens/min.

微信截图_20240807110150.png

Em 1º de julho, a plataforma aberta Kimi anunciou o início do teste público do cache de contexto (Context Caching).

O cache de contexto (Context Caching) é uma técnica eficiente de gerenciamento de dados que permite ao sistema armazenar previamente grandes quantidades de dados ou informações que provavelmente serão solicitadas com frequência.

Dessa forma, quando você solicita as mesmas informações novamente, o sistema pode fornecê-las rapidamente a partir do cache, sem precisar recalcular ou recuperar dados da fonte original, economizando tempo e recursos.

O cache de contexto (Context Caching) é especialmente adequado para cenários com solicitações frequentes e referências repetidas a grandes contextos iniciais, podendo reduzir significativamente os custos de modelos de texto longo e aumentar a eficiência!

O Lado Escuro da Lua lança o kimi-latest: Experimente o modelo mais recente do Kimi em primeira mão

Em 18 de fevereiro, a Beijing MoonShot Technology Co., Ltd. anunciou o lançamento do modelo mais recente, o kimi-latest, na plataforma aberta Kimi, com o objetivo de fornecer aos desenvolvedores e empresas uma capacidade de geração de IA mais poderosa e estável. Desde o teste público da plataforma aberta Kimi em 31 de janeiro de 2024, os modelos da série moonshot-v1 têm sido o suporte principal do assistente inteligente Kimi.

通义AI desmente gastos de marketing de bilhões: dados seriamente imprecisos, investimento real foi menor

A Alibaba, por meio da conta oficial do Weibo da sua plataforma de IA, desmentiu publicamente os dados de gastos de marketing de seus produtos de IA que circularam recentemente na internet. Dados divulgados anteriormente na internet indicavam que várias empresas de IA gastaram centenas de milhões em marketing no terceiro trimestre, incluindo dados específicos sobre os gastos da plataforma Tongyi Qianwen, gerando grande interesse. De acordo com a resposta oficial da Tongyi AI, os dados divulgados na internet, como os 4,5 milhões gastos em marketing no terceiro trimestre e os 900 mil gastos nos primeiros 20 dias de outubro, não correspondem à realidade. A empresa declarou explicitamente que os valores reais investidos foram muito menores do que os divulgados, mas não divulgou os dados reais.

OpenAI aprimora significativamente sua API em tempo real: redução de preço superior a 50% e cinco novas vozes

Hoje, a OpenAI anunciou atualizações para sua API em tempo real, ainda em fase de testes. O destaque é o lançamento de cinco novas opções de voz, projetadas especificamente para aplicativos de voz para voz, além de uma redução significativa nos custos de cache, tornando-a mais acessível para desenvolvedores. Em uma publicação no X, a OpenAI apresentou três das cinco novas vozes: Ash, Verse e Ballad (com sotaque britânico). Essas vozes oferecem uma qualidade de áudio aprimorada...

Notícias e Informações de IA

Plataforma Aberta Kimi da Lua Escura: Preço do Armazenamento em Cache de Contexto Reduzido em 50%

AIbase基地

Notícias de IA Relacionadas Recomendadas

Sem treinamento! Q-Filters permite compressão eficiente de cache KV e melhora o desempenho de inferência

O Lado Escuro da Lua lança o kimi-latest: Experimente o modelo mais recente do Kimi em primeira mão

通义AI desmente gastos de marketing de bilhões: dados seriamente imprecisos, investimento real foi menor

OpenAI aprimora significativamente sua API em tempo real: redução de preço superior a 50% e cinco novas vozes