Nach zwei Preissenkungen im Mai und September dieses Jahres hat Alibaba Cloud erneut Preissenkungen für seine großen Sprachmodelle angekündigt – die dritte Preisanpassung in diesem Jahr. Die diesmalige Senkung ist besonders deutlich: Die Preise für die visuellen Verständnismodelle der Tongyi Qianwen-Serie wurden um über 80 % reduziert.
Das Qwen-VL-Plus-Modell wurde um 81 % günstiger und kostet nun nur noch 0,0015 Yuan pro 1000 Tokens – der niedrigste Preis im gesamten Netz. Das leistungsstärkere Qwen-VL-Max-Modell kostet jetzt 0,003 Yuan pro 1000 Tokens, was einer Preissenkung von 85 % entspricht. Mit einem Yuan können nun etwa 600 Bilder mit 720p oder 1700 Bilder mit 480p verarbeitet werden.
Die Qwen-VL-Serie großer Sprachmodelle ist ein von Alibaba Cloud entwickeltes multimodales Modell und hat sich zu einem der beliebtesten Modelle in der Open-Source-Community entwickelt. Es verfügt über leistungsstarke visuelle Inferenzfähigkeiten. Das Modell kann nicht nur Bilder unterschiedlicher Auflösung und Seitenverhältnisse erkennen, sondern auch lange Videos (über 20 Minuten) verstehen und besitzt die Fähigkeit, intelligente Agenten wie Handys und Roboter visuell zu steuern. Qwen-VL wird in verschiedenen visuellen Erkennungsszenarien auf verschiedenen Endgeräten eingesetzt, darunter Handys und Autos.
Das Alibaba Cloud Bailen-Team erklärte, dass die Preissenkung hauptsächlich auf die kontinuierliche Optimierung der Alibaba Cloud-Infrastruktur und der Modellstruktur sowie auf den Skaleneffekt des exponentiellen Wachstums der Modellnutzungszahlen zurückzuführen ist. Durch den technischen Fortschritt und die Optimierung konnte die Inferenzeffizienz von Alibaba Cloud deutlich gesteigert werden. Das von Alibaba Cloud entwickelte elastische KI-Rechenleistungssteuerungssystem, kombiniert mit der Bailen-verteilten Inferenzbeschleunigungs-Engine, reduziert nicht nur die Kosten für die Modellinferenz erheblich, sondern beschleunigt auch die Inferenzgeschwindigkeit. Alibaba Cloud erwähnte auch, dass Qwen-VL aufgrund der kontinuierlichen Optimierung der visuellen Verständnisleistung zu einem der am schnellsten wachsenden Modelle auf der Bailen-Plattform geworden ist.
Um die Kosten für die Nutzung der großen Sprachmodell-API weiter zu senken, hat Alibaba Cloud Bailen ein neues KV-Cache-Abrechnungsmodell eingeführt. Dieses Modell vermeidet durch automatische Zwischenspeicherung des Kontexts redundante Berechnungen und senkt so die Kosten für Modellanrufe deutlich. Dies ist besonders vorteilhaft für lange Texte, Code-Vervollständigung, mehrstufige Dialoge, spezifische Textzusammenfassungen usw.
Durch die kontinuierliche Optimierung der Infrastruktur und der Modelle durch Alibaba Cloud machen die Preissenkungen für die visuellen Verständnismodelle der Qwen-VL-Serie KI-Technologien zugänglicher und eröffnen Entwicklern und Unternehmen mehr Anwendungsmöglichkeiten. Durch die kontinuierliche Optimierung der Leistung und die Senkung der Nutzungskosten fördert Alibaba Cloud die Verbreitung und Anwendung von KI-Technologien und bietet eine stärkere technologische Unterstützung für die digitale Transformation in allen Branchen.