A empresa chinesa de inteligência artificial DeepSeek anunciou o lançamento do DeepGEMM, uma biblioteca de código aberto que suporta a multiplicação de matrizes (GEMM) de ponto flutuante de precisão 8 bits (FP8), no terceiro dia de sua “Semana do Código Aberto”. Essa ferramenta foi projetada para operações de matrizes intensivas e para modelos especialistas mistos (MoE), oferecendo suporte robusto para o treinamento e inferência dos modelos DeepSeek V3 e R1. O anúncio oficial, feito via plataforma X, gerou grande repercussão na comunidade tecnológica.

image.png

De acordo com a publicação da conta oficial da DeepSeek, o DeepGEMM alcança desempenho de cálculo FP8 de até 1350+ TFLOPS em GPUs NVIDIA Hopper. Sua lógica central possui apenas cerca de 300 linhas de código, mas supera núcleos otimizados por especialistas na maioria dos tamanhos de matriz, demonstrando alta eficiência e simplicidade. A biblioteca não requer dependências complexas, utiliza a técnica de compilação just-in-time (JIT), suporta layouts densos e dois layouts MoE, e seu design é “tão limpo quanto um tutorial”, facilitando o aprendizado e o uso pelos desenvolvedores.

O usuário do X @TechBitDaily comentou: “O lançamento do DeepGEMM é um grande destaque da Semana do Código Aberto da DeepSeek, seu desempenho FP8 e design simples são impressionantes.” Outro usuário, @AIObserverCN, apontou que a biblioteca apresenta vantagens significativas no treinamento eficiente de modelos MoE, podendo impulsionar novas inovações na comunidade de IA em arquiteturas Hopper.

Como parte da Semana do Código Aberto, o lançamento do DeepGEMM reforça o compromisso da DeepSeek com a transparência em tecnologia de IA e a colaboração da comunidade. Nos dois primeiros dias, a empresa já havia lançado as ferramentas FlashMLA e DeepEP, focadas em arquitetura de modelos de linguagem rápida e comunicação paralela de especialistas, respectivamente. O lançamento do DeepGEMM demonstra ainda mais sua força tecnológica na construção de infraestrutura de IA. Especialistas do setor acreditam que essa biblioteca não apenas melhorará o desempenho dos modelos da própria DeepSeek, mas também fornecerá aos desenvolvedores globais uma ferramenta de operação de matrizes eficiente e fácil de usar, com um futuro promissor. Os usuários podem acessar o DeepGEMM via GitHub e explorar seu potencial em treinamento e inferência de IA.

Endereço do projeto: https://github.com/deepseek-ai/DeepGEMM