API da Anthropic lança recurso de cache de prompts: reduz significativamente o custo e a latência da interação com IA

AIbase基地

Publicado emNotícias e Informações de IA · 4 minutos de leitura · Aug 15, 2024

149

A Anthropic API lançou recentemente o recurso de cache de prompts, permitindo que os desenvolvedores agora armazenem em cache informações de contexto comumente usadas entre chamadas de API. Com o cache de prompts, os clientes podem fornecer ao modelo Claude mais informações de contexto e exemplos de saída, reduzindo significativamente o custo de prompts longos, com economia de até 90% e redução de latência de até 85%.

Este recurso está atualmente disponível nas versões beta públicas do Claude 3.5 Sonnet e Claude 3 Haiku, e suporte para o Claude 3 Opus será adicionado no futuro.

QQ截图20240815093542.png

O recurso de cache de prompts é particularmente útil nos seguintes cenários: quando é necessário referenciar repetidamente um grande contexto de prompt em várias solicitações, como em agentes de conversação para reduzir o custo e a latência de conversas longas, especialmente aquelas com instruções complexas ou upload de documentos; assistentes de codificação podem melhorar o preenchimento automático e as perguntas e respostas do repositório de código mantendo uma versão resumida do repositório de código no prompt; ao lidar com documentos grandes, o cache de prompts permite incorporar materiais longos completos sem aumentar o tempo de resposta; além disso, para cenários de busca de agentes e uso de ferramentas que envolvem chamadas de ferramentas multi-turnos e alterações iterativas, o cache de prompts também pode melhorar significativamente o desempenho.

QQ截图20240815093549.png

O preço do cache de prompts depende da quantidade de tokens de entrada armazenados em cache e da frequência de uso. O custo de gravação no cache é 25% maior do que o preço do token de entrada básico, enquanto o custo de usar o conteúdo do cache é significativamente menor, apenas 10% do preço do token de entrada básico.

Notion, como cliente da Anthropic API, já integrou o recurso de cache de prompts ao seu assistente de IA, Notion AI. Ao reduzir custos e aumentar a velocidade, a Notion otimizou suas operações internas e ofereceu aos usuários uma experiência mais avançada e rápida.

Shenzhen planeja criar fundo de capital estatal de 500 bilhões de yuans, com foco em IA e robótica

De acordo com a reportagem do Jie Mian News, a Comissão de Patrimônio Estatal de Shenzhen anunciou planos para estabelecer um fundo de capital estatal de até 500 bilhões de yuans, focado em inteligência artificial, robótica e outras áreas de tecnologia de ponta. Segundo o plano, as empresas estatais de Shenzhen, seguindo as decisões do comitê e governo municipal, irão ativamente construir uma rede de fundos de inovação tecnológica que abrange toda a cadeia industrial “20+8”. O fundo visa fornecer apoio financeiro a empresas de tecnologia em todos os estágios, desde a fase inicial (seed), anjo, série A, série B, série C até o IPO. Nota sobre a imagem.

LiblibAI recebe mais centenas de milhões em investimentos, quebrando recordes de velocidade de financiamento!

O setor de aplicativos de IA na China registra mais um evento de financiamento de grande impacto! A plataforma de criação de conteúdo com IA LiblibAI-哩布哩布AI anunciou hoje que, em apenas um ano, concluiu impressionantemente quatro rodadas de financiamento, estabelecendo um recorde sem precedentes de velocidade de financiamento no setor de aplicativos de IA na China. Após a divulgação de um financiamento de centenas de milhões em julho de 2024, a LiblibAI conseguiu mais centenas de milhões em investimentos, demonstrando um forte crescimento e atraindo grande atenção do setor. Segundo informações,

Notícias e Informações de IA

API da Anthropic lança recurso de cache de prompts: reduz significativamente o custo e a latência da interação com IA

AIbase基地

Notícias de IA Relacionadas Recomendadas

Shenzhen planeja criar fundo de capital estatal de 500 bilhões de yuans, com foco em IA e robótica

Grupo ByteDance planeja buscar fornecedores de rotulagem de dados de IA com capital registrado não inferior a um milhão

AiPoetry Tecnologia conclui rodada de financiamento A5, mirando novas alturas na área de geração de vídeo com IA

LiblibAI recebe mais centenas de milhões em investimentos, quebrando recordes de velocidade de financiamento!