Corps principal : Récemment, l’équipe chinoise DeepSeek a lancé son nouveau grand modèle open source R1, qui a suscité un vif intérêt. Les performances du modèle R1 sont exceptionnelles, surpassant le modèle o1 d’OpenAI dans de nombreux tests, notamment en mathématiques et en programmation.

image.png

Lors du dernier test AIME2024 aux États-Unis, R1 a obtenu un score de 79,8 points, dépassant les 79,2 points de o1. Au test MATH-500, R1 a obtenu 97,3 points, devançant également les 96,4 points de o1. De plus, au test SWE-bench Verified, R1 a obtenu un score de 49,2, supérieur aux 48,9 points de o1. Bien que R1 n'ait obtenu que 0,3 point de moins que o1 au test de code Codeforces, ses performances globales sont comparables à celles du modèle o1.

Au-delà de ses performances, l’avantage en termes de coût de R1 est encore plus remarquable. Le modèle o1 d’OpenAI coûte jusqu’à 15 $ pour 1 million de jetons en entrée, tandis que R1 ne coûte que 0,14 $, soit une réduction de 90 % des coûts. Pour la sortie, o1 coûte 60 $ pour 1 million de jetons, alors que R1 ne coûte que 2,19 $, soit une réduction de 27 fois. Cette énorme différence de coût permet à R1 de se démarquer dans le domaine des grands modèles open source.

Après l’annonce de la publication en open source de R1 par l’équipe DeepSeek, de nombreux internautes étrangers ont exprimé leur admiration pour ce modèle, estimant que R1 surpasse les plateformes open source établies telles que Meta et Mistral en termes de rapport qualité-prix et de performances. Beaucoup ont souligné que la capacité d’inférence efficace de R1 le rend performant dans des domaines tels que la programmation et l’explication mathématique. Certains utilisateurs l’ont même qualifié de « modèle le plus proche du monologue intérieur humain ». Awni Hannun, chercheur en apprentissage automatique chez Apple, a également testé R1 et a constaté qu’il fonctionnait rapidement et efficacement sur une puce Apple M2 Ultra.

Le développement du modèle R1 a nécessité plusieurs étapes d’entraînement, notamment des données de démarrage à froid et un entraînement en plusieurs étapes, afin d’améliorer ses capacités d’inférence et sa lisibilité. Ces améliorations techniques ont garanti les performances exceptionnelles du modèle R1 dans diverses tâches.

Avec le lancement de R1, les grands modèles open source chinois ont de nouveau suscité un vif intérêt et des discussions sur le marché international. De nombreux passionnés de technologie attendent avec impatience le potentiel de ce modèle. La publication de R1 marque une nouvelle avancée de la Chine dans le domaine des grands modèles, stimulant le développement des technologies open source.

Adresse open source : https://huggingface.co/deepseek-ai/R1

API : https://api-docs.deepseek.com/guides/reasoning_model

Points clés :

🌟 Le modèle R1 surpasse le modèle o1 d’OpenAI dans de nombreux tests, démontrant des performances exceptionnelles.

💰 Les coûts d’entrée et de sortie de R1 sont respectivement de seulement 0,14 $ et 2,19 $, soit une réduction de 90 % des coûts.

🚀 Depuis sa publication en open source, R1 a suscité un vif intérêt, de nombreux experts étrangers saluant ses performances et son excellent rapport qualité-prix.