Recentemente, a startup francesa de inteligência artificial Mistral AI anunciou seus modelos de linguagem de nova geração: Ministral3B e Ministral8B.
Esses dois novos modelos fazem parte da série "Ministraux", projetados para dispositivos de borda e cenários de computação de borda, suportando um comprimento de contexto de até 128.000 tokens. Isso significa que esses modelos não apenas possuem capacidade de processamento poderosa, mas também podem ser usados em situações onde a privacidade de dados e o processamento local são particularmente importantes.
A Mistral afirma que os modelos da série Ministraux são ideais para uma variedade de aplicações, como tradução local, assistentes inteligentes offline, análise de dados e robótica autônoma. Para melhorar ainda mais a eficiência, os modelos Ministraux também podem ser combinados com modelos de linguagem maiores (como o Mistral Large) como intermediários eficazes em fluxos de trabalho de várias etapas.
Em termos de desempenho, os testes de referência fornecidos pela Mistral mostram que os Ministral3B e 8B superam muitos modelos semelhantes em várias categorias, como o Gemma22B da Cohere e o Llama3.18B do Meta. Vale ressaltar que, apesar do menor número de parâmetros do Ministral3B, ele superou seu predecessor, o Mistral7B, em alguns testes.
Na verdade, o Mistral8B teve um desempenho excelente em todos os testes, especialmente em áreas como conhecimento, senso comum, chamadas de funções e capacidades multilíngues.
Quanto ao preço, os dois novos modelos da Mistral AI já estão disponíveis por meio de API. O Ministral8B custa US$ 0,10 por milhão de tokens, enquanto o Ministral3B custa US$ 0,04. Além disso, a Mistral também fornece os pesos do modelo Ministral8B Instruct para fins de pesquisa. É importante notar que esses dois novos modelos da Mistral também serão lançados em breve por meio de parceiros em nuvem como o Google Vertex e a AWS.
Destaques:
- 🚀 A Mistral AI lança os modelos Ministral3B e 8B, com suporte para comprimento de contexto de até 128.000 tokens.
- 💡 Esses modelos são adequados para tradução local, assistentes offline, análise de dados e robótica autônoma.
- 💰 Em termos de preço, o Ministral8B custa US$ 0,10 por milhão de tokens, enquanto o Ministral3B custa US$ 0,04.