DeepSeek ha lanzado oficialmente y de código abierto su último modelo de lenguaje grande, R1, que muestra un rendimiento excepcional y se considera comparable a la versión oficial de o1 de OpenAI. Este hito no solo representa un gran avance en la tecnología de IA nacional, sino que también ofrece a los desarrolladores de IA de todo el mundo una nueva opción.
DeepSeek R1 ha aplicado ampliamente la técnica de aprendizaje por refuerzo en la etapa de post-entrenamiento, mejorando significativamente la capacidad de razonamiento del modelo incluso con datos etiquetados escasos. En tareas clave como matemáticas, código e inferencia de lenguaje natural, el rendimiento de DeepSeek R1 es comparable al de la versión oficial de OpenAI o1, demostrando su gran potencia.

Para retribuir a la comunidad de código abierto, DeepSeek también ha publicado de código abierto los modelos DeepSeek-R1 y DeepSeek-R1-Zero, ambos con 660B parámetros. Además, DeepSeek ha publicado de código abierto 6 modelos más pequeños a través de la técnica de destilación de modelos, incluyendo modelos con 32B y 70B parámetros. Estos modelos más pequeños superan a o1-mini de OpenAI en varias capacidades, enriqueciendo aún más el ecosistema de código abierto.

En cuanto a la fijación de precios de la API, DeepSeek también muestra una actitud abierta: el costo por cada millón de tokens de entrada con caché es de solo 1 yuan, mientras que sin caché es de 4 yuanes; el costo por cada millón de tokens de salida es de 16 yuanes, ofreciendo un precio general más competitivo.

Más importante aún, DeepSeek R1 utiliza la licencia MIT estándar, permitiendo su uso comercial sin restricciones. DeepSeek también anima a los usuarios a utilizar los resultados de R1 para entrenar otros modelos, impulsando aún más la popularización y el desarrollo de la tecnología de IA. La publicación de código abierto de DeepSeek R1 sin duda proporcionará a los desarrolladores de todo el mundo herramientas más potentes, inyectando nueva vitalidad en la innovación y aplicación de la tecnología de IA, y presagiando la aceleración de la era de la igualdad de acceso a la tecnología de IA.
Artículo: https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
Documentación de la API: https://api-docs.deepseek.com/zh-cn/guides/reasoning_model