今年5月と9月に2度の値下げを行った後、アリババクラウドは再び大規模言語モデルの値下げを発表し、今年3度目の価格調整を実施しました。今回の値下げ幅は非常に大きく、通義千問シリーズの画像認識モデル全線が80%以上値下げされました。
特に、Qwen-VL-Plusモデルは81%も値下げされ、入力価格はわずか0.0015元/千トークンとなり、業界最安値を記録しました。より高性能なQwen-VL-Maxは0.003元/千トークンに値下げされ、値下げ幅は85%に達します。新しい価格設定によると、1元で最大約600枚の720P画像、または1700枚の480P画像を処理できます。
Qwen-VLシリーズ大規模言語モデルは、アリババクラウドが発表したマルチモーダル大規模言語モデルであり、オープンソースコミュニティで最も人気のあるモデルの1つとなっています。強力な視覚推論能力を備え、様々な解像度やアスペクト比の画像を識別できるだけでなく、20分以上の長尺ビデオも理解し、スマートフォンやロボットなどのインテリジェントデバイスを自律的に操作できる視覚認識能力も備えています。Qwen-VLは、スマートフォンや自動車など、様々な端末の画像認識シーンで広く利用されています。
アリババクラウドの百煉チームは、今回の値下げは主にアリババクラウドのインフラストラクチャとモデル構造の継続的な最適化、そして大規模言語モデルの呼び出し量の指数関数的な増加による規模の経済効果によるものだと述べています。技術の進歩と最適化により、アリババクラウドの推論効率は大幅に向上しました。アリババクラウドが構築した弾性AIコンピューティングスケジューリングシステムと百煉分散推論加速エンジンを組み合わせることで、モデル推論コストの大幅な削減と推論速度の向上を実現しました。また、Qwen-VLの画像認識効果の継続的な最適化により、このモデルは百煉プラットフォームで最も急速に成長しているモデルの1つとなっています。
ユーザーによる大規模言語モデルAPIのコストをさらに削減するため、アリババクラウド百煉は新しいKVキャッシュ課金モデルを発表しました。このモデルはコンテキストを自動的にキャッシュすることで、重複計算を回避し、モデル呼び出しコストを大幅に削減します。特に、長文、コード補完、多様な会話、特定のテキスト要約などのシナリオに適しています。
アリババクラウドがインフラストラクチャとモデルを継続的に最適化することで、Qwen-VLシリーズ画像認識モデルの値下げは、AI技術をより身近なものにするだけでなく、開発者や企業に多くの利用機会をもたらします。パフォーマンスの継続的な最適化と使用コストの削減を通じて、アリババクラウドはAI技術の普及と応用を推進し、あらゆる業界のデジタル変革に強力な技術サポートを提供しています。