Mistral lança o Codestral 25.01, modelo de programação de última geração, com velocidade de programação duas vezes maior

A empresa Mistral anunciou recentemente a atualização de seu modelo de geração de código de código aberto, Codestral, lançando a nova versão Codestral25.01. Esta atualização aumenta significativamente a competitividade do modelo na área de programação, com o objetivo de fornecer aos desenvolvedores uma experiência de geração de código mais eficiente.

De acordo com o post do blog da Mistral, a arquitetura do Codestral25.01 foi otimizada, prometendo ser o "líder absoluto" entre modelos semelhantes, com uma velocidade de geração de código duas vezes maior que a versão anterior. Esta nova versão mantém as vantagens do modelo original, focando em baixa latência e operações de alta frequência, suportando tarefas como correção de código, geração de testes e preenchimento de código. A Mistral afirma que isso é particularmente importante para empresas com grandes quantidades de dados e cenários de uso com residência de modelos.

Em vários testes de benchmark, o Codestral25.01 apresentou excelente desempenho em testes de codificação Python, obtendo uma alta pontuação de 86,6% no teste HumanEval, superando versões anteriores do Codestral, Codellama70B Instruct e DeepSeek Coder33B Instruct.

Os desenvolvedores podem usar o Codestral25.01 por meio dos parceiros de plug-ins IDE da Mistral. Além disso, os usuários podem acessar a API do modelo por meio da plataforma da Mistral e do Google Vertex AI. Atualmente, o modelo está disponível em prévia no Azure AI Foundry e será lançado no Amazon Bedrock.

Desde o lançamento inicial do Codestral em maio de 2023, a Mistral tem impulsionado continuamente as atualizações e inovações de seus produtos. O modelo Codestral-Mamba, lançado anteriormente, baseado na arquitetura Mamba, pode gerar strings de código mais longas e processar mais entradas. É importante notar que, algumas horas após o anúncio da Mistral, o Codestral25.01 rapidamente subiu no ranking do Copilot Arena, demonstrando o forte interesse do mercado por este novo modelo.

A escrita de código, como um dos primeiros recursos dos modelos básicos, embora também seja aplicada em modelos gerais como o o3 da OpenAI e o Claude da Anthropic, tem visto um progresso significativo no último ano, muitas vezes superando alguns grandes modelos gerais. Recentemente, Alibaba, DeepSeek Coder e Microsoft também lançaram novos modelos de programação, intensificando a competição.

Entre muitos desenvolvedores, ainda existe um debate sobre a escolha entre modelos gerais e modelos focados em programação. Alguns desenvolvedores preferem usar modelos gerais como o Claude, enquanto a demanda por tarefas de programação impulsiona o surgimento contínuo de modelos especializados. Como o Codestral é treinado especificamente para dados de codificação, seu desempenho em tarefas de programação é naturalmente superior.

Blog oficial: https://mistral.ai/news/codestral-2501/

Destaques:
🌟 A Mistral lança o Codestral25.01, com velocidade de geração de código duas vezes maior que a versão anterior.
💻 O modelo apresentou excelente desempenho em testes de codificação Python, obtendo 86,6% na pontuação do teste HumanEval.
📈 O Codestral25.01 rapidamente atingiu o topo do Copilot Arena, recebendo ampla atenção dos desenvolvedores.

Notícias e Informações de IA

Mistral lança o Codestral 25.01, modelo de programação de última geração, com velocidade de programação duas vezes maior

AIbase基地

Notícias de IA Relacionadas Recomendadas

Zhipu AI conclui rodada de financiamento superior a 1 bilhão de yuans e planeja lançar modelo de linguagem de grande escala de nova geração de código aberto

Claude 3.7 Sonnet chega ao Perplexity Pro: melhorias significativas no fluxo de trabalho de agentes e geração de código

Você não vai acreditar! Repita esta simples instrução para acelerar a geração de código de IA em 100 vezes

Atualização Importante! Claude agora com recurso de análise de dados - análise e geração de código com facilidade!