L'API Anthropic lance la mise en cache des invites : réduction significative des coûts et de la latence des interactions avec l'IA

AIbase基地

Publié leActualités IA · 4 minutes de lecture · Aug 15, 2024

149

L'API Anthropic a récemment introduit une fonctionnalité de mise en cache des invites, permettant désormais aux développeurs de mettre en cache des informations contextuelles fréquemment utilisées entre les appels API. Grâce à la mise en cache des invites, les clients peuvent fournir au modèle Claude davantage de connaissances contextuelles et d'exemples de sorties, tout en réduisant considérablement les coûts liés aux invites longues, jusqu'à 90%, et en diminuant la latence jusqu'à 85%.

Cette fonctionnalité est actuellement disponible en version bêta publique pour Claude 3.5 Sonnet et Claude 3 Haiku, et sera prochainement étendue à Claude 3 Opus.

QQ截图20240815093542.png

La mise en cache des invites est particulièrement utile dans les scénarios suivants : lorsqu'un contexte d'invite volumineux doit être référencé à plusieurs reprises dans des requêtes multiples, comme dans les agents conversationnels pour réduire les coûts et la latence des longues conversations, notamment celles impliquant des instructions complexes ou le téléchargement de documents ; les assistants de codage peuvent améliorer l'autocomplétion et les questions-réponses sur les bases de code en conservant une version résumée de la base de code dans l'invite ; lors du traitement de documents volumineux, la mise en cache des invites permet d'intégrer des documents longs sans augmenter le temps de réponse ; enfin, pour les scénarios de recherche d'agents et d'utilisation d'outils impliquant des appels d'outils à plusieurs tours et des modifications itératives, la mise en cache des invites améliore considérablement les performances.

QQ截图20240815093549.png

La tarification de la mise en cache des invites dépend du nombre de jetons d'entrée mis en cache et de la fréquence d'utilisation. Le coût d'écriture en cache est supérieur de 25 % au prix des jetons d'entrée de base, tandis que le coût d'utilisation du contenu mis en cache est considérablement réduit, à seulement 10 % du prix des jetons d'entrée de base.

Notion, client de l'API Anthropic, a intégré la fonctionnalité de mise en cache des invites à son assistant d'intelligence artificielle, Notion AI. En réduisant les coûts et en augmentant la vitesse, Notion a optimisé ses opérations internes et offert à ses utilisateurs une expérience plus avancée et plus rapide.

Luma AI : IMM, une technique de pré-entraînement d'images open source pour une génération d'images dix fois plus rapide

Ne trouvez-vous pas que les modèles d'images entraînés avec d'énormes quantités de données sont incroyablement lents lorsqu'il s'agit de générer des images de haute qualité ? Ne vous inquiétez pas, Luma AI a récemment open-sourcé une technique de pré-entraînement de modèles d'images appelée Inductive Moment Matching (IMM), qui permettrait aux modèles de générer des images de haute qualité à une vitesse fulgurante. Un véritable turbocompresseur pour votre fourneau alchimique ! Le progrès algorithmique au point mort ? Luma AI pulvérise le plafond ! Ces dernières années, la communauté de l'IA a largement...

Shenzhen prévoit de créer un fonds de capital d'État de 500 milliards de yuans, axé sur l'IA et la robotique

Selon des informations de Jie Mian News, la Commission des actifs d'État de Shenzhen a annoncé son intention de créer un fonds de capital d'État d'un montant de 500 milliards de yuans, axé sur les technologies de pointe telles que l'intelligence artificielle et la robotique. Conformément au plan, les entreprises publiques de Shenzhen, s'appuyant sur les décisions du Comité municipal et du gouvernement municipal, créeront activement un réseau de fonds d'innovation technologique couvrant toute la chaîne industrielle « 20+8 ». Ce fonds vise à fournir un soutien financier aux entreprises technologiques à tous les stades, de la phase de démarrage et des tours d'amorçage (Angel) aux tours A, B, C et jusqu'à l'introduction en bourse (IPO). Source de l'image : remarque

Actualités IA

L'API Anthropic lance la mise en cache des invites : réduction significative des coûts et de la latence des interactions avec l'IA

AIbase基地

Recommandations d'actualités IA connexes

Luma AI : IMM, une technique de pré-entraînement d'images open source pour une génération d'images dix fois plus rapide

Shenzhen prévoit de créer un fonds de capital d'État de 500 milliards de yuans, axé sur l'IA et la robotique

Une nuit de viralité ! L'équipe derrière le nouveau produit IA Manus s'appelle Effet Papillon

ByteDance envisage de rechercher des fournisseurs d'étiquetage de données IA, avec un capital social d'au moins un million