ChinaZ.com (站长之家) - 18 de junho de 2024: A DeepSeek anunciou recentemente o lançamento de um modelo de código aberto chamado DeepSeek-Coder-V2. Este modelo supera o GPT-4-Turbo em termos de capacidade de código e matemática, além de apresentar uma expansão significativa no suporte multilíngue e no comprimento do processamento de contexto.
Baseado na estrutura do modelo DeepSeek-V2, o DeepSeek-Coder-V2 utiliza uma arquitetura de mistura de especialistas (MoE), projetada especificamente para aprimorar a capacidade de raciocínio de código e matemática.
O DeepSeek-Coder-V2 apresenta desempenho de ponta globalmente, com destaque para sua capacidade de geração de código e aritmética matemática. Este modelo, juntamente com seu código e artigo relacionados, foi totalmente disponibilizado como código aberto para uso comercial gratuito, sem necessidade de solicitação. O modelo está disponível em dois tamanhos: 236B de parâmetros e 16B de parâmetros, para atender às diferentes necessidades de aplicação.
Em termos de suporte multilíngue, o DeepSeek-Coder-V2 expandiu o suporte a linguagens de programação de 86 para 338, atendendo a uma variedade maior de necessidades de desenvolvimento. Simultaneamente, o comprimento do contexto suportado foi expandido de 16K para 128K, permitindo o processamento de conteúdo de entrada mais longo. O DeepSeek-Coder-V2 também oferece serviço de API com suporte a contexto de 32K, com preço consistente com o DeepSeek-V2.
Em testes de referência padrão, o DeepSeek-Coder-V2 superou alguns modelos proprietários em geração de código, preenchimento de código, correção de código e raciocínio matemático. Os usuários podem baixar diferentes versões do modelo DeepSeek-Coder-V2, incluindo versões básicas e com instruções, bem como versões com diferentes escalas de parâmetros.
A DeepSeek também fornece uma plataforma de experiência online e link do GitHub, além de um relatório técnico, para facilitar a compreensão e o uso do DeepSeek-Coder-V2. O lançamento deste modelo não apenas traz capacidades poderosas de processamento de código e matemática para a comunidade de código aberto, mas também contribui para o desenvolvimento e aplicação de tecnologias relacionadas.
Endereço do projeto: https://top.aibase.com/tool/deepseek-coder-v2
Experiência online: https://chat.deepseek.com/sign_in