Recentemente, a DeepSeek, por meio de seus modelos de linguagem amplos DeepSeek-R1, V3 e Coder, foi integrada oficialmente à plataforma de internet de supercomputação nacional (www.scnet.cn). Com o suporte da capacidade de computação de fusão de superinteligência nacional e do sistema nacional unificado de serviços de computação, a indústria chinesa de modelos de linguagem amplos para IA deu um passo crucial.
A plataforma de internet de supercomputação nacional já lançou as versões 1.5B, 7B, 8B e 14B do modelo DeepSeek-R1. Os usuários podem experimentar o serviço de inferência online por meio de código QR ou interface da web, sem necessidade de implantação local. Para atender às necessidades de empresas, a plataforma suporta a introdução de dados proprietários para o desenvolvimento personalizado de modelos privados, e versões com parâmetros maiores, como 32B e 70B, também serão lançadas em breve. Também foram lançados simultaneamente os modelos de domínio vertical DeepSeek-V3, Coder e Math (7B), cobrindo uma variedade de cenários, como geração de código e raciocínio matemático.
Em comparação com os modelos de linguagem amplos estrangeiros, a série DeepSeek, por meio da otimização de algoritmos, reduz significativamente o consumo de recursos computacionais. Combinada com a capacidade de escalonamento de computação “acessível e fácil de usar, rica e prática” da plataforma de supercomputação nacional, ela consegue reduzir drasticamente o custo de chamada. O DeepSeek-R1-Distill-Qwen-7B, por exemplo, oferece uma interface de conversa WebUI de fácil acesso, enquanto os usuários corporativos podem acessar rapidamente o ambiente de produção por meio de uma interface de API, formando uma cadeia completa, desde a chamada do modelo até a implantação privada.
Analistas apontam que a implementação em larga escala dos modelos DeepSeek na plataforma de supercomputação pode mudar a situação atual na qual a indústria de IA doméstica depende de modelos de código fechado estrangeiros. À medida que mais desenvolvedores treinarem e otimizarem modelos localizados com base na infraestrutura de computação nacional, a China poderá realizar uma “ultrapassagem em curva” em massa na aplicação de tecnologias de IA. Essa onda de busca impulsionada por uma “força misteriosa do Oriente” está injetando novas variáveis na competição global de IA.