Après deux baisses de prix en mai et septembre de cette année, Alibaba Cloud a annoncé une nouvelle réduction de prix pour ses grands modèles, marquant ainsi sa troisième baisse de prix de l'année. Cette baisse de prix est très significative, avec une réduction de plus de 80 % sur toute la gamme des modèles de compréhension visuelle de la série Tongyi Qianwen.
Le prix du modèle Qwen-VL-Plus a ainsi été réduit de 81 %, son coût d'entrée n'étant plus que de 0,0015 yuan pour 1 000 tokens, soit le prix le plus bas du marché ; quant au modèle Qwen-VL-Max, plus performant, son prix a été réduit à 0,003 yuan pour 1 000 tokens, soit une baisse de 85 %. Avec cette nouvelle tarification, 1 yuan permet de traiter jusqu'à environ 600 images en 720p ou 1 700 images en 480p.
La série de grands modèles Qwen-VL est un modèle multi-modal développé par Alibaba Cloud, devenu l'un des modèles les plus populaires de la communauté open source. Il possède de puissantes capacités de raisonnement visuel. Ce modèle est capable non seulement d'identifier des images de différentes résolutions et proportions, mais aussi de comprendre des vidéos longues de plus de 20 minutes, et même de contrôler des smartphones et des robots grâce à sa capacité de compréhension visuelle. Qwen-VL est largement utilisé dans divers scénarios de reconnaissance visuelle sur différents terminaux, notamment les téléphones portables et les automobiles.
L'équipe Alibaba Cloud Bailen a déclaré que cette baisse de prix était principalement due à l'optimisation continue des infrastructures et de la structure des modèles d'Alibaba Cloud, ainsi qu'aux effets d'échelle liés à la croissance exponentielle du volume d'appels des grands modèles. Grâce aux progrès et à l'optimisation technologiques, l'efficacité de l'inférence d'Alibaba Cloud s'est considérablement améliorée. Le système d'ordonnancement de la puissance de calcul IA élastique d'Alibaba Cloud, combiné au moteur d'accélération d'inférence distribuée Bailen, a non seulement considérablement réduit les coûts d'inférence des modèles, mais a également accéléré la vitesse d'inférence. Alibaba Cloud a également mentionné que, grâce à l'optimisation continue des performances de compréhension visuelle de Qwen-VL, ce modèle est devenu l'un des modèles à la croissance la plus rapide de la plateforme Bailen.
Afin de réduire encore davantage les coûts d'utilisation de l'API des grands modèles pour les utilisateurs, Alibaba Cloud Bailen a également lancé un nouveau mode de facturation KV Cache. Ce mode, grâce à la mise en cache automatique du contexte, évite les calculs redondants, réduisant ainsi considérablement les coûts d'appel des modèles, notamment pour les longs textes, le complément de code, les conversations à plusieurs tours et la synthèse de textes spécifiques.
Grâce à l'optimisation continue des infrastructures et des modèles par Alibaba Cloud, la baisse de prix des modèles de compréhension visuelle de la série Qwen-VL rend la technologie de l'IA plus accessible et offre aux développeurs et aux entreprises davantage d'opportunités d'application. En optimisant continuellement les performances et en réduisant les coûts d'utilisation, Alibaba Cloud favorise la démocratisation et l'application de la technologie de l'IA, offrant un support technique plus puissant pour la transformation numérique de tous les secteurs.