2025-03-07 16:19:22.AIbase.
Sem treinamento! Q-Filters permite compressão eficiente de cache KV e melhora o desempenho de inferência
2024-08-15 10:40:39.AIbase.
Claude lança recurso de "cache de prompts", permitindo que desenvolvedores armazenem em cache contextos comuns na API
2024-08-15 09:40:28.AIbase.
API da Anthropic lança recurso de cache de prompts: reduz significativamente o custo e a latência da interação com IA
2024-07-02 08:16:15.AIbase.