A startup francesa de IA, Mistral, anunciou recentemente o lançamento de uma série de novos modelos de IA generativa, projetados especificamente para dispositivos de borda, como laptops e smartphones. A Mistral batizou esta série de modelos como "Les Ministraux", com o objetivo de atender à crescente demanda do mercado por processamento local e priorização da privacidade.
A nova série Les Ministraux inclui dois modelos: Ministral3B e Ministral8B. É importante destacar que ambos os modelos possuem uma janela de contexto de 128.000 tokens, capazes de processar aproximadamente 50 páginas de texto. Isso significa que esses modelos podem lidar com facilidade com geração de texto, tradução no dispositivo e até mesmo fornecer serviços de assistente inteligente offline.
Em seu blog, a Mistral afirma que um número crescente de clientes e parceiros está buscando soluções capazes de realizar inferências localmente, abrangendo aplicações importantes como tradução em dispositivos, análise local e robótica autônoma. Os Les Ministraux foram desenvolvidos para oferecer soluções computacionalmente eficientes e com baixa latência nesses cenários.
Atualmente, o Ministral8B está disponível para download, mas apenas para fins de pesquisa. Desenvolvedores e empresas que desejam obter licença comercial para o Ministral3B ou Ministral8B precisam entrar em contato diretamente com a Mistral. Os desenvolvedores também podem usar esses modelos por meio da plataforma em nuvem da Mistral, La Platforme, e de outros serviços em nuvem parceiros nas próximas semanas. O preço do Ministral8B é de US$ 0,10 por milhão de tokens de entrada/saída, enquanto o Ministral3B custa US$ 0,04.
Recentemente, a tendência de modelos menores tem crescido, pois seus custos de treinamento, ajuste fino e operação são menores e mais rápidos. O Google continua adicionando novos modelos à sua série de modelos menores Gemma, enquanto a Microsoft lançou a série Phi. O Meta também lançou vários modelos menores otimizados para hardware de borda em sua última atualização da série Llama.
A Mistral afirma que os Ministral3B e Ministral8B superaram modelos similares da Llama e Gemma, além do próprio modelo Mistral7B da empresa, em vários benchmarks de IA projetados para avaliar a obediência a instruções e a capacidade de resolução de problemas.
Com sede em Paris, a Mistral recentemente arrecadou US$ 640 milhões em investimentos e está expandindo gradualmente seu portfólio de produtos de IA. Nos últimos meses, a empresa lançou um serviço gratuito que permite aos desenvolvedores testar seus modelos, além de um SDK para que os clientes possam ajustar finamente esses modelos. Também foi lançado um modelo de geração de código chamado Codestral.
Os cofundadores da Mistral são ex-funcionários do Meta e do DeepMind do Google. O objetivo da empresa é criar modelos principais que possam competir com modelos de ponta como o GPT-4o da OpenAI e o Claude da Anthropic, e gerar lucros no processo. Embora a "lucratividade" seja um desafio para muitas startups de IA generativa, a Mistral teria começado a gerar receita no verão deste ano.
Destaques:
1. 🚀 A Mistral lançou a série de modelos Les Ministraux, projetados para dispositivos de borda, com suporte para processamento local e privacidade.
2. 💡 Os novos modelos incluem Ministral3B e Ministral8B, com capacidade de processamento de contexto excepcional, aplicáveis a diversos cenários.
3. 💰 A Mistral já está lucrativa e continua expandindo seu portfólio de produtos de IA, buscando competir com os modelos líderes do setor.