A empresa Mistral anunciou recentemente a atualização de seu modelo de geração de código de código aberto, Codestral, lançando a nova versão Codestral25.01. Esta atualização aumenta significativamente a competitividade do modelo na área de programação, com o objetivo de fornecer aos desenvolvedores uma experiência de geração de código mais eficiente.
De acordo com o post do blog da Mistral, a arquitetura do Codestral25.01 foi otimizada, prometendo ser o "líder absoluto" entre modelos semelhantes, com uma velocidade de geração de código duas vezes maior que a versão anterior. Esta nova versão mantém as vantagens do modelo original, focando em baixa latência e operações de alta frequência, suportando tarefas como correção de código, geração de testes e preenchimento de código. A Mistral afirma que isso é particularmente importante para empresas com grandes quantidades de dados e cenários de uso com residência de modelos.
Em vários testes de benchmark, o Codestral25.01 apresentou excelente desempenho em testes de codificação Python, obtendo uma alta pontuação de 86,6% no teste HumanEval, superando versões anteriores do Codestral, Codellama70B Instruct e DeepSeek Coder33B Instruct.
Os desenvolvedores podem usar o Codestral25.01 por meio dos parceiros de plug-ins IDE da Mistral. Além disso, os usuários podem acessar a API do modelo por meio da plataforma da Mistral e do Google Vertex AI. Atualmente, o modelo está disponível em prévia no Azure AI Foundry e será lançado no Amazon Bedrock.
Desde o lançamento inicial do Codestral em maio de 2023, a Mistral tem impulsionado continuamente as atualizações e inovações de seus produtos. O modelo Codestral-Mamba, lançado anteriormente, baseado na arquitetura Mamba, pode gerar strings de código mais longas e processar mais entradas. É importante notar que, algumas horas após o anúncio da Mistral, o Codestral25.01 rapidamente subiu no ranking do Copilot Arena, demonstrando o forte interesse do mercado por este novo modelo.
A escrita de código, como um dos primeiros recursos dos modelos básicos, embora também seja aplicada em modelos gerais como o o3 da OpenAI e o Claude da Anthropic, tem visto um progresso significativo no último ano, muitas vezes superando alguns grandes modelos gerais. Recentemente, Alibaba, DeepSeek Coder e Microsoft também lançaram novos modelos de programação, intensificando a competição.
Entre muitos desenvolvedores, ainda existe um debate sobre a escolha entre modelos gerais e modelos focados em programação. Alguns desenvolvedores preferem usar modelos gerais como o Claude, enquanto a demanda por tarefas de programação impulsiona o surgimento contínuo de modelos especializados. Como o Codestral é treinado especificamente para dados de codificação, seu desempenho em tarefas de programação é naturalmente superior.
Blog oficial: https://mistral.ai/news/codestral-2501/
Destaques:
🌟 A Mistral lança o Codestral25.01, com velocidade de geração de código duas vezes maior que a versão anterior.
💻 O modelo apresentou excelente desempenho em testes de codificação Python, obtendo 86,6% na pontuação do teste HumanEval.
📈 O Codestral25.01 rapidamente atingiu o topo do Copilot Arena, recebendo ampla atenção dos desenvolvedores.