A DeepSeek lançou recentemente e tornou de código aberto seu mais novo modelo de linguagem grande, o R1, que demonstra desempenho excepcional e é considerado comparável à versão oficial do o1 da OpenAI. Este lançamento não apenas representa um grande avanço na tecnologia de IA nacional, mas também oferece aos desenvolvedores de IA em todo o mundo uma nova opção.

O DeepSeek R1 utilizou extensivamente técnicas de aprendizado por reforço na fase de pós-treinamento, melhorando significativamente sua capacidade de raciocínio mesmo com dados rotulados limitados. Em tarefas cruciais como matemática, codificação e raciocínio em linguagem natural, o desempenho do DeepSeek R1 se equipara ao da versão oficial do OpenAI o1, demonstrando sua força.

image.png

Para retribuir à comunidade de código aberto, a DeepSeek também disponibilizou os modelos DeepSeek-R1 e DeepSeek-R1-Zero, ambos com 660 bilhões de parâmetros. Além disso, a DeepSeek, por meio da técnica de destilação de modelos, lançou seis modelos menores, incluindo modelos com 32 bilhões e 70 bilhões de parâmetros. Esses modelos menores superam o o1-mini da OpenAI em várias capacidades, enriquecendo ainda mais o ecossistema de código aberto.

image.png

Em termos de preços da API, a DeepSeek também demonstra sua postura aberta: o custo por milhão de tokens de entrada em cache é de apenas 1 yuan, enquanto o custo para tokens não em cache é de 4 yuan; o custo por milhão de tokens de saída é de 16 yuan, oferecendo um preço geral mais competitivo.

image.png

Mais importante ainda, o DeepSeek R1 utiliza a licença MIT padrão, permitindo o uso comercial ilimitado. A DeepSeek também incentiva os usuários a utilizarem os resultados do R1 para treinar outros modelos, promovendo ainda mais a popularização e o desenvolvimento da tecnologia de IA. A disponibilização do DeepSeek R1 como código aberto, sem dúvida, fornecerá aos desenvolvedores globais ferramentas mais poderosas e injetará nova vitalidade na inovação e aplicação da tecnologia de IA, sinalizando a chegada acelerada da era da igualdade na tecnologia de IA.

Artigo científico: https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

Documentação da API: https://api-docs.deepseek.com/zh-cn/guides/reasoning_model