DeepSeek-R1 est le premier modèle d'inférence lancé par l'équipe DeepSeek. Entraîné par apprentissage par renforcement à grande échelle, il démontre une capacité d'inférence remarquable sans nécessiter d'ajustement fin supervisé. Ce modèle excelle dans les tâches mathématiques, de codage et d'inférence, atteignant des performances comparables à celles du modèle OpenAI-o1. DeepSeek-R1 propose également plusieurs modèles distillés, adaptés à des besoins d'échelle et de performance variés. Son caractère open source offre aux chercheurs un outil puissant, autorisant l'utilisation commerciale et le développement secondaire.