Con la creciente competencia mundial en el campo de la inteligencia artificial, los modelos de IA nacionales están surgiendo rápidamente. Recientemente, los tres principales modelos de IA nacionales, DeepSeek, Kimi y MiniMax, han lanzado nuevas versiones, mostrando un potencial para competir con la serie GPT de OpenAI.
El 20 de enero, DeepSeek lanzó oficialmente DeepSeek-R1 y publicó el peso del modelo de código abierto. DeepSeek-R1 utiliza ampliamente la técnica de aprendizaje por refuerzo en la etapa de post-entrenamiento, mejorando significativamente la capacidad de razonamiento del modelo con una cantidad mínima de datos etiquetados. Según sus datos de prueba, este modelo supera al o1 de OpenAI en varias pruebas estándar como AIME2024, MATH-500 y SWE-bench Verified en Estados Unidos, mostrando una poderosa capacidad de razonamiento matemático, de código y de lenguaje natural.
El mismo día, Kimi también lanzó su nuevo modelo SOTA: el modelo de pensamiento multimodal k1.5. Kimi anunció oficialmente que este modelo ha alcanzado el nivel de la versión oficial o1 de OpenAI en el modo long-CoT, y ha superado significativamente a los modelos de vanguardia existentes en términos de capacidad multimodal matemática, de código y visual en el modo short-CoT, superando a GPT-4o y Claude3.5Sonnet.
El modelo Minimax-01, lanzado por MiniMax el 15 de enero, también mostró un rendimiento excelente. Su rendimiento en varias pruebas estándar es comparable al de GPT-4o y Claude3.5-Sonnet, mostrando una ventaja significativa en el procesamiento de contextos largos. El rendimiento de estos tres productos de IA nacionales demuestra el rápido progreso de la tecnología nacional.
Al mismo tiempo, el precio del servicio API de DeepSeek es muy competitivo, significativamente más bajo que el de OpenAI. Por ejemplo, el cargo por cada millón de tokens de entrada de DeepSeek-R1 es de solo 1 yuan chino, mientras que el GPT-o1 de OpenAI cuesta 15 dólares estadounidenses (aproximadamente 110 yuanes chinos), lo que da a DeepSeek una clara ventaja en términos de relación calidad-precio.
El auge de los grandes modelos nacionales no solo representa una competencia a nivel tecnológico, sino que también aumenta la demanda de potencia de cálculo. Los expertos del sector predicen que, con el continuo crecimiento de la demanda del mercado, China experimentará nuevas oportunidades de desarrollo en la construcción de capacidad de cálculo en el futuro. Grandes empresas como ByteDance y Xiaomi también están invirtiendo activamente para mejorar la infraestructura de capacidad de cálculo nacional, y la competencia futura será aún más feroz.
El rápido desarrollo de la IA nacional es esperanzador. En la competencia futura, si podrá igualar o incluso superar a OpenAI, solo el tiempo lo dirá.