Actualités IA

Ne manquez aucun moment de l'innovation mondiale en IA

IA Quotidien

Tendances quotidiennes de l'industrie de l'IA en trois minutes

Chronologie de l'IA

Jalons de l'industrie de l'IA

Al hardware

liste tous les produits de matériel AI.

Guide de monétisation de l'IA

Derniers cas

Partage de cas de monétisation de l'IA

Collection d'images

Cas de monétisation de la création d'images par l'IA

Collection de vidéos

Cas de monétisation de la création de vidéos par l'IA

Collection audio

Cas de monétisation de la création audio par l'IA

Collection de contenu

Cas de monétisation de la rédaction de contenu par l'IA

Tutoriels IA

Derniers tutoriels

Partage gratuit des derniers tutoriels IA

Classements des produits IA

Classement des produits IA

Affiche le classement du nombre total de visites des sites web d'IA

Classement de la croissance du trafic IA

Suit les sites web d'IA à la croissance la plus rapide en termes de trafic

Classement de la baisse du trafic IA

Se concentre sur les sites web d'IA avec des baisses de trafic importantes

Classement hebdomadaire de l'IA

Affiche le classement hebdomadaire des visites des sites web d'IA

Classements des pays populaires

États-Unis

Sites web d'IA les plus populaires auprès des utilisateurs américains

Chine

Sites web d'IA les plus populaires auprès des utilisateurs chinois

Inde

Sites web d'IA les plus populaires auprès des utilisateurs indiens

Brésil

Sites web d'IA les plus populaires auprès des utilisateurs brésiliens

Classements des catégories populaires

Génération d'images

Classement du nombre total de visites des sites web de génération d'images par l'IA

Assistant personnel

Classement du nombre total de visites des sites web d'assistants personnels d'IA

Génération de personnages

Classement du nombre total de visites des sites web de génération de personnages par l'IA

Génération de vidéos

Classement du nombre total de visites des sites web de génération de vidéos par l'IA

Classements des données Open Source populaires

Classement des projets IA

Projets IA populaires sur GitHub par nombre total d'étoiles

Classement de la croissance des projets IA

Projets IA populaires sur GitHub par taux de croissance

Classement des développeurs IA

Classement des développeurs IA populaires sur GitHub

Classement des organisations IA

Classement des organisations IA populaires sur GitHub

Catégories Open Source populaires

Deepseek

Projets Open Source Deepseek populaires sur GitHub

TTS

Projets Open Source TTS populaires sur GitHub

LLM

Projets Open Source LLM populaires sur GitHub

ChatGPT

Projets Open Source ChatGPT populaires sur GitHub

Bibliothèque de projets Open Source IA

Aperçu

Aperçu des projets Open Source IA populaires sur GitHub

Bibliothèque de produits Navigation de l'outil

Plateforme ouverte Kimi de la face cachée de la lune : lancement de la phase de test public du « cache contextuel », réduction de 90 % du coût des modèles de texte long

AIbase

Publié leActualités IA · 6 minutes de lecture · Jul 2, 2024

201

Hier, la plateforme ouverte Kimi de la société 月之暗面 a annoncé le lancement de la phase de test public de la mise en cache du contexte (Context Caching). Cette technologie permet aux développeurs de réduire jusqu'à 90 % le coût d'utilisation des grands modèles linguistiques pour les longs textes, sans augmentation du prix de l'API, et améliore considérablement la vitesse de réponse du modèle.

La mise en cache du contexte (Context Caching) est une technique de gestion de données efficace qui permet au système de stocker à l'avance de grandes quantités de données ou d'informations susceptibles d'être fréquemment demandées. Ainsi, lorsque vous demandez à nouveau les mêmes informations, le système peut les fournir rapidement à partir du cache, sans avoir à les recalculer ou à les récupérer à partir de la source de données d'origine, ce qui permet d'économiser du temps et des ressources. La mise en cache du contexte (Context Caching) est particulièrement adaptée aux scénarios de requêtes fréquentes et de références répétées à un grand nombre de contextes initiaux, ce qui permet de réduire considérablement les coûts des modèles de longs textes et d'améliorer l'efficacité !

微信截图_20240702081354.png

Plus précisément, la « mise en cache du contexte » peut être appliquée aux scénarios de requêtes fréquentes et de références répétées à un grand nombre de contextes initiaux, ce qui produit les deux effets suivants :

Réduction des coûts jusqu'à 90 % : Par exemple, pour les scénarios nécessitant de nombreuses questions sur un document fixe, la mise en cache du contexte permet de réaliser d'importantes économies. Par exemple, pour un manuel de produit matériel d'environ 90 000 mots, si le personnel du support avant-vente doit effectuer de nombreuses questions-réponses en peu de temps, le recours à la mise en cache du contexte peut réduire les coûts à environ 10 % du coût initial.
Réduction du délai du premier jeton de 83 % : Pour une requête d'un modèle 128k, il faut généralement 30 secondes pour renvoyer le premier jeton. Grâce à la mise en cache du contexte, le délai du premier jeton peut être réduit en moyenne à 5 secondes, soit une réduction de 83 % du temps de latence.

Le modèle de tarification de la mise en cache du contexte (Context Caching) est principalement divisé en trois parties :

Frais de création du cache :
Appel de l'interface de création du cache. Une fois le cache créé avec succès, les jetons du cache sont facturés en fonction de la quantité réelle. 24 yuans/M jetons
Frais de stockage du cache :
Pendant la durée de vie du cache, les frais de stockage du cache sont facturés à la minute. 10 yuans/M jetons/minute
Frais d'appel du cache :
Les frais pour les jetons incrémentaux de l'appel du cache : facturés au prix initial du modèle
Frais de nombre d'appels du cache :
Pendant la durée de vie du cache, si l'utilisateur effectue une requête via l'interface de chat sur un cache créé avec succès, et si le contenu du message de chat correspond au cache actif, les frais d'appel du cache seront facturés en fonction du nombre d'appels. 0,02 yuan/appel

Sauvegarde de documents haut et bas Plateforme ouverte Kimi La face cachée de la lune Grand modèle de navire de texte long

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily