Recientemente, la serie completa de modelos grandes de DeepSeek, incluyendo DeepSeek-R1, V3 y Coder, se integraron oficialmente en la plataforma de internet de supercomputación nacional (www.scnet.cn). Con el apoyo de la potencia de computación de fusión súper inteligente nacional y el sistema nacional unificado de servicios de potencia de computación, la industria china de modelos grandes de IA ha dado un paso crucial.

La plataforma de internet de supercomputación nacional ya ha lanzado las versiones 1.5B, 7B, 8B y 14B del modelo DeepSeek-R1. Los usuarios pueden experimentar el servicio de inferencia en línea directamente escaneando un código QR o a través de la página web, sin necesidad de implementación local. Para las necesidades empresariales, la plataforma admite la introducción de datos privados para el desarrollo personalizado de modelos privados. Las versiones con más parámetros, como 32B y 70B, también se abrirán sucesivamente en un futuro próximo. Simultáneamente, también se lanzaron modelos de dominio vertical como DeepSeek-V3, la serie Coder y la serie Math (7B), cubriendo una variedad de escenarios como la generación de código y la inferencia matemática.

QQ20250205-143146.png

En comparación con los modelos grandes de ultramar, la serie DeepSeek, mediante la optimización de algoritmos, reduce significativamente el consumo de recursos de computación. Combinado con la capacidad de programación de potencia de computación "accesible y fácil de usar, rica y útil" de la plataforma de supercomputación nacional, se logra una considerable reducción del costo de llamada. Tomando DeepSeek-R1-Distill-Qwen-7B como ejemplo, su interfaz de conversación WebUI admite una experiencia de cero umbral, mientras que los usuarios empresariales solo necesitan acceder a través de la interfaz API para integrarse rápidamente en el entorno de producción, formando una cadena completa desde la llamada del modelo hasta la implementación privada.

Los analistas señalan que la implementación a gran escala de los modelos DeepSeek en la plataforma de supercomputación podría cambiar la situación actual en la que la industria de la IA nacional depende de modelos de código cerrado extranjeros. A medida que más desarrolladores entrenen y optimicen modelos locales basados en la infraestructura de potencia de computación nacional, China podría lograr un "adelantamiento en la curva" masivo en la aplicación de la tecnología de IA. Esta ola de búsqueda impulsada por una "misteriosa fuerza oriental" está inyectando nuevas variables en la competencia mundial de IA.