A Mistral AI anunciou recentemente o lançamento de seu modelo de linguagem grande de última geração, o Mistral Large2, que apresenta avanços significativos em termos de custo-benefício, velocidade e desempenho.

Visão geral do modelo

O Mistral Large2 é um modelo com 123 bilhões de parâmetros e uma janela de contexto de 128K. Ele suporta dezenas de idiomas, incluindo inglês, francês, alemão, espanhol, italiano, português, árabe, hindi, russo, chinês, japonês e coreano, além de mais de 80 linguagens de programação, como Python, Java, C, C++, JavaScript e Bash.

Destaques de desempenho

QQ_1721867063415.png

Desempenho geral: Na avaliação MMLU, a versão pré-treinada do Mistral Large2 atingiu uma precisão de 84,0%.

QQ_1721867086970.png

QQ_1721867110778.png

Capacidade de código e raciocínio: Em termos de geração de código e raciocínio matemático, o Mistral Large2 apresenta desempenho comparável a modelos líderes, como GPT-4, Claude3Opus e Llama3405B.

QQ_1721867130761.png

Capacidade multilíngue: Em testes de referência MMLU multilíngues, o Mistral Large2 demonstrou excelente capacidade de processamento de linguagem multilíngue, com desempenho excepcional em idiomas principais como inglês, francês e alemão.

Instruções e alinhamento: Em testes de referência como MT-Bench, Wild Bench e Arena Hard, o Mistral Large2 mostrou uma melhoria significativa na capacidade de seguir instruções e em conversas.

Uso de ferramentas e chamadas de funções: O modelo foi treinado para executar chamadas de funções paralelas e sequenciais, oferecendo suporte robusto para aplicativos comerciais complexos.

Características técnicas

Redução significativa de "alucinações", melhorando a confiabilidade e a precisão da saída.

Melhora na capacidade de autoconhecimento do modelo quando não encontra soluções ou informações suficientes.

Foco na geração de respostas concisas e relevantes, aumentando a eficiência da interação e o custo-benefício.

Aplicações e disponibilidade

O Mistral Large2 está disponível na la Plateforme sob o nome "mistral-large-2407".

Os pesos do modelo foram abertos e estão hospedados no HuggingFace.

A Mistral AI expandiu sua parceria com o Google Cloud Platform para oferecer serviços de API gerenciados por meio do Vertex AI.

O modelo também está acessível por meio de provedores de serviços em nuvem como Azure AI Studio, Amazon Bedrock e IBM watsonx.ai.

Licença e termos de uso

O Mistral Large2 é lançado sob a Licença de Pesquisa Mistral, permitindo seu uso para fins de pesquisa e não comerciais. O uso comercial requer a aquisição da Licença Comercial Mistral.

O lançamento deste novo modelo marca um avanço significativo da Mistral AI na área de modelos de linguagem grandes, oferecendo aos desenvolvedores de aplicativos de inteligência artificial ferramentas mais poderosas e flexíveis, com potencial para impulsionar aplicações inovadoras em diversos setores.