A AI21Labs lançou recentemente seu mais recente modelo de linguagem grande, o Jamba1.6, considerado o modelo de processamento de texto longo mais poderoso e eficiente do mercado atualmente. Comparado aos modelos Transformer tradicionais, o modelo Jamba demonstra maior velocidade e qualidade no processamento de contextos longos, sendo 2,5 vezes mais rápido na inferência do que modelos similares, representando um novo avanço tecnológico.

A série Jamba1.6 inclui o Jamba Mini (1,2 bilhão de parâmetros) e o Jamba Large (9,4 bilhões de parâmetros), otimizados especificamente para aplicações comerciais, com recursos de chamada de funções, saída estruturada (como JSON) e capacidade de geração baseada em realidade. A gama de aplicações desses modelos é ampla, desde assistentes inteligentes corporativos até pesquisas acadêmicas.

Este modelo utiliza a licença de código aberto Jamba Open Model License, permitindo o uso para pesquisa e fins comerciais, desde que os termos relevantes sejam cumpridos. Além disso, o prazo de conhecimento da série Jamba1.6 é 5 de março de 2024, suportando vários idiomas, incluindo inglês, espanhol, francês, português, italiano, holandês, alemão, árabe e hebraico, garantindo sua adaptação às necessidades globais dos usuários.

Em termos de avaliação de desempenho, o Jamba Large 1.6 apresentou resultados excelentes em vários testes de referência. Em testes padrão como Arena Hard, CRAG e FinanceBench, suas pontuações superaram as de seus concorrentes, demonstrando sua excepcional capacidade de compreensão e geração de linguagem. Seu desempenho é particularmente notável no processamento de textos longos.

Para garantir a inferência eficiente, os usuários do modelo Jamba devem instalar as bibliotecas Python relevantes e possuir um dispositivo CUDA para suporte à execução do modelo. Os usuários podem executar o modelo por meio das estruturas vLLM ou transformers. Com o suporte de GPUs em larga escala, o Jamba Large 1.6 pode processar contextos de até 256K, algo inatingível em modelos anteriores.

Modelo: https://huggingface.co/ai21labs/AI21-Jamba-Large-1.6

Destaques:

🌟 O modelo Jamba1.6 é mais rápido e de maior qualidade no processamento de textos longos, suportando múltiplos idiomas.

🚀 A licença de código aberto permite o uso para pesquisa e fins comerciais, promovendo o compartilhamento de tecnologia.

💡 Apresentou desempenho superior em vários testes de referência, superando produtos concorrentes.