O Qwen2.5-Turbo é um modelo de linguagem desenvolvido pela equipe da Alibaba capaz de processar textos extremamente longos. Otimizado a partir do Qwen2.5, suporta contextos de até 1 milhão de tokens, equivalente a aproximadamente 1 milhão de palavras em inglês ou 1,5 milhão de caracteres chineses. Alcançou 100% de precisão na tarefa Passkey Retrieval com 1 milhão de tokens e obteve uma pontuação de 93,1 no benchmark RULER para textos longos, superando o GPT-4 e o GLM4-9B-1M. Além do excelente desempenho no processamento de textos longos, o Qwen2.5-Turbo mantém alta performance no processamento de textos curtos, com alta relação custo-benefício: apenas 0,3 yuan por 1 milhão de tokens.