Texto: Recentemente, a equipe chinesa DeepSeek lançou seu mais novo modelo de linguagem grande de código aberto, o R1, que recebeu ampla atenção. O desempenho do modelo R1 é excepcional, superando o modelo o1 da OpenAI em vários testes, especialmente em avaliações de matemática e programação.

image.png

No recente teste americano AIME2024, o R1 obteve 79,8 pontos, superando os 79,2 pontos do o1. No teste MATH-500, o R1 alcançou 97,3 pontos, também à frente dos 96,4 pontos do o1. Além disso, no teste SWE-bench Verified, o R1 obteve 49,2 pontos, superando os 48,9 pontos do o1. Embora no teste de código Codeforces, o R1 tenha ficado apenas 0,3 pontos abaixo do o1, seu desempenho geral é comparável ao modelo o1.

Além do desempenho, a vantagem de custo do R1 é ainda mais notável. O modelo o1 da OpenAI custa US$ 15 por 1 milhão de tokens de entrada, enquanto o R1 custa apenas US$ 0,14, uma redução de custo de 90%. Na saída, o o1 custa US$ 60 por 1 milhão de tokens, enquanto o R1 custa apenas US$ 2,19, uma redução de 27 vezes. Essa enorme diferença de custo faz com que o R1 se destaque no campo dos modelos de linguagem grandes de código aberto.

Após o anúncio do lançamento do código aberto do R1 pela equipe DeepSeek, muitos usuários internacionais expressaram sua admiração pelo modelo, considerando que o R1 supera plataformas de código aberto tradicionais como Meta e Mistral em termos de custo-benefício e desempenho. Muitos afirmaram que a capacidade de raciocínio eficiente do modelo R1 o torna excelente em tarefas como escrita de código e explicações matemáticas, com alguns usuários até mesmo o chamando de "o modelo mais parecido com o monólogo interno humano". Ao mesmo tempo, o pesquisador de aprendizado de máquina da Apple, Awni Hannun, também testou o R1 e descobriu que ele funciona rapidamente e com alta eficiência de raciocínio no Apple M2 Ultra.

O desenvolvimento do modelo R1 passou por vários estágios de treinamento, incluindo dados de inicialização a frio e treinamento em várias etapas, para melhorar sua capacidade de raciocínio e legibilidade. Essas melhorias técnicas garantem o desempenho excepcional do modelo R1 em várias tarefas.

Com o lançamento do R1, os modelos de linguagem grandes de código aberto da China voltaram a chamar a atenção e gerar discussões no mercado internacional, com muitos entusiastas da tecnologia expressando expectativa pelo potencial do modelo. O lançamento do R1 marca uma nova conquista da China na área de modelos de linguagem grandes, impulsionando o desenvolvimento de tecnologias de código aberto.

Endereço do código aberto: https://huggingface.co/deepseek-ai/R1

API: https://api-docs.deepseek.com/guides/reasoning_model

Destaques:

🌟 O modelo R1 superou o o1 da OpenAI em vários testes, demonstrando um desempenho excepcional.

💰 Os custos de entrada e saída do R1 são de apenas US$ 0,14 e US$ 2,19, respectivamente, representando uma redução de custo de 90%.

🚀 O R1, após o lançamento do código aberto, recebeu ampla atenção, com muitos especialistas internacionais elogiando seu desempenho e seu excelente custo-benefício.