AI21Labs ha lanzado recientemente su último modelo de lenguaje grande, Jamba1.6, considerado el modelo más potente y eficiente del mercado para el procesamiento de textos largos. En comparación con los modelos Transformer tradicionales, Jamba muestra una mayor velocidad y calidad en el manejo de contextos largos, con una velocidad de inferencia 2,5 veces superior a la de modelos similares, lo que representa un gran avance tecnológico.

La serie Jamba1.6 incluye Jamba Mini (1.200 millones de parámetros) y Jamba Large (9.400 millones de parámetros), optimizados específicamente para aplicaciones comerciales. Ofrecen funciones de llamada a funciones, salida estructurada (como JSON) y capacidad de generación basada en la realidad. Su aplicación es amplia, desde asistentes inteligentes empresariales hasta investigación académica.

Este modelo utiliza la licencia de código abierto Jamba Open Model License, que permite su uso con fines de investigación y comerciales, siempre que se cumplan las condiciones correspondientes. Además, la fecha límite de conocimiento de la serie Jamba1.6 es el 5 de marzo de 2024. Admite varios idiomas, incluyendo inglés, español, francés, portugués, italiano, neerlandés, alemán, árabe y hebreo, garantizando su adaptabilidad a las necesidades globales.

En cuanto a las pruebas de rendimiento, Jamba Large 1.6 ha destacado en varias pruebas de referencia. En pruebas estándar como Arena Hard, CRAG y FinanceBench, sus puntuaciones superan a las de sus competidores, demostrando su excepcional capacidad de comprensión y generación del lenguaje. Su rendimiento es especialmente notable en el procesamiento de textos largos.

Para una inferencia eficiente, los usuarios de Jamba deben instalar las bibliotecas Python correspondientes y disponer de una unidad CUDA para ejecutar el modelo. Se puede ejecutar a través de los frameworks vLLM o transformers. Con el soporte de GPU a gran escala, Jamba Large 1.6 puede procesar contextos de hasta 256K, algo inigualable en modelos anteriores.

Modelo: https://huggingface.co/ai21labs/AI21-Jamba-Large-1.6

Puntos clave:

🌟 Jamba1.6 es más rápido y preciso en el procesamiento de textos largos y admite múltiples idiomas.

🚀 Su licencia de código abierto permite su uso en investigación y aplicaciones comerciales, fomentando el intercambio tecnológico.

💡 Ofrece un rendimiento excepcional en diversas pruebas de referencia, superando a sus competidores.