DeepSeek-R1 es el primer modelo de inferencia lanzado por el equipo de DeepSeek. Entrenado mediante aprendizaje por refuerzo a gran escala, exhibe una capacidad de razonamiento excepcional sin necesidad de ajuste fino supervisado. El modelo destaca en tareas matemáticas, de código y de razonamiento, siendo comparable al modelo OpenAI-o1. DeepSeek-R1 también ofrece varios modelos destilado, aptos para escenarios con diferentes escalas y requisitos de rendimiento. Su naturaleza de código abierto proporciona una herramienta poderosa para la comunidad investigadora, permitiendo su uso comercial y desarrollo secundario.