Durante o último fim de semana e meio, a influência do DeepSeek cresceu constantemente, alcançando vários avanços importantes. A plataforma nacional de supercomputação na internet lançou oficialmente o DeepSeek-R1, versão que suporta até 671B de funcionalidades completas. Além disso, o chip XuanTie da Pingtouge adaptou com sucesso o modelo destilado da série DeepSeek-R1, expandindo ainda mais o espaço de aplicação em CPUs com arquitetura RISC-V e plataformas de computação de borda.
Durante o feriado do Ano Novo Lunar chinês, as três principais operadoras de telecomunicações integraram totalmente o DeepSeek, marcando que o alcance da aplicação do DeepSeek transcendeu os campos de IA e internet, penetrando em setores mais profundos. Isso significa que usuários e desenvolvedores não precisam mais se preocupar com o problema de "servidor ocupado" ao usar o DeepSeek, desfrutando de uma experiência mais eficiente.
Observação da fonte: Imagem gerada por IA, provedor de serviços de licenciamento de imagens Midjourney
Com o aumento da popularidade do DeepSeek, muitos provedores de serviços em nuvem aproveitaram a oportunidade e começaram a reduzir os preços. A Tencent Cloud foi a primeira a lançar o DeepSeek com suporte à pesquisa na internet, integrando simultaneamente a pesquisa Sogou, fornecendo uma API aprimorada de pesquisa e suportando a integração de bancos de dados de conhecimento privado, permitindo que os usuários integrem bancos de dados de conhecimento com um único clique. Ao mesmo tempo, a SenseTime e a Alibaba Cloud também responderam, com a plataforma de grandes dispositivos da SenseTime oferecendo 10 milhões de tokens gratuitos por um período limitado de três meses, enquanto a Alibaba Cloud oferece 1 milhão de tokens gratuitos para novos usuários, e o preço do modelo destilado também é relativamente baixo.
Na área de chips, várias empresas estão acelerando a disputa de mercado. A placa gráfica MI300X da AMD aumentou a velocidade de aplicação do DeepSeek-R1 em três vezes e lançou uma imagem Docker oficial. Ao mesmo tempo, além do ecossistema CUDA da NVIDIA, o ROCm da AMD também oferece aos usuários uma nova opção. Novos chips de inferência de IA, como Groq, Cerebras e Sambanova, aumentaram ainda mais a velocidade de inferência do DeepSeek-R1-Distill Llama-70B para 500 a 1500 tokens por segundo, fazendo com que os usuários quase não percebam o tempo de espera.
Há também uma notícia interessante: o domínio ai.com foi redirecionado para o site oficial do DeepSeek, com rumores de que o DeepSeek adquiriu o domínio por um alto preço. Vale notar que este domínio já pertenceu ao ChatGPT e à xAI, e a imagem de marca do DeepSeek será ainda mais destacada no futuro.