Tras dos bajadas de precio en mayo y septiembre de este año, Alibaba Cloud ha anunciado una nueva rebaja en sus modelos de lenguaje extenso, la tercera de este año. Esta vez, la reducción de precio es muy significativa, con una bajada de más del 80% en toda la línea de modelos de comprensión visual de Tongyi Qianwen.

El precio del modelo Qwen-VL-Plus se ha reducido en un 81%, con un coste de entrada de solo 0,0015 yuanes/mil tokens, el precio más bajo de todo el mercado; mientras que el Qwen-VL-Max, de mayor rendimiento, se ha reducido a 0,003 yuanes/mil tokens, con una bajada del 85%. Con la nueva tarifa, 1 yuan permite procesar aproximadamente 600 imágenes de 720P o 1700 imágenes de 480P.

Alibaba Cloud

La serie de modelos de lenguaje extenso Qwen-VL es un modelo multimodal desarrollado por Alibaba Cloud, y se ha convertido en uno de los modelos más populares de la comunidad de código abierto, con una potente capacidad de razonamiento visual. Este modelo no solo puede identificar imágenes de diferentes resoluciones y relaciones de aspecto, sino que también puede comprender vídeos largos de más de 20 minutos y tiene la capacidad de comprender visualmente y operar de forma autónoma dispositivos inteligentes como teléfonos móviles y robots. Qwen-VL se utiliza ampliamente en escenarios de reconocimiento visual en todo tipo de dispositivos, incluyendo teléfonos móviles y automóviles.

QQ20241231-153317.png

El equipo de Alibaba Cloud Bailen ha declarado que esta bajada de precio se debe principalmente a la continua optimización de la infraestructura y la estructura del modelo de Alibaba Cloud, así como a los efectos de escala derivados del crecimiento exponencial del volumen de llamadas al modelo de lenguaje extenso. Con el progreso y la optimización continuos de la tecnología, la eficiencia de la inferencia de Alibaba Cloud ha mejorado significativamente. El sistema de programación de potencia de cálculo AI elástico construido por Alibaba Cloud, combinado con el motor de aceleración de inferencia distribuida Bailen, no solo ha reducido considerablemente el coste de la inferencia del modelo, sino que también ha acelerado la velocidad de inferencia. Alibaba Cloud también ha mencionado que, a medida que la capacidad de comprensión visual de Qwen-VL sigue mejorando, este modelo se ha convertido en uno de los modelos de más rápido crecimiento de la plataforma Bailen.

Para reducir aún más el coste de uso de la API del modelo de lenguaje extenso para los usuarios, Alibaba Cloud Bailen también ha lanzado un nuevo modelo de facturación KV Cache. Este modelo, mediante el almacenamiento en caché automático del contexto, evita los cálculos repetidos, lo que reduce significativamente el coste de las llamadas al modelo, especialmente en escenarios como textos largos, completado de código, diálogos de varias rondas y resúmenes de textos específicos.

Gracias a la continua optimización de la infraestructura y los modelos por parte de Alibaba Cloud, la bajada de precio de los modelos de comprensión visual de la serie Qwen-VL no solo hace que la tecnología de IA sea más accesible, sino que también ofrece a los desarrolladores y empresas más oportunidades de aplicación. Mediante la continua optimización del rendimiento y la reducción de los costes de uso, Alibaba Cloud está impulsando la popularización y aplicación de la tecnología de IA, proporcionando un soporte técnico más sólido para la transformación digital de todos los sectores.