La aplicación de DeepSeek, una empresa china de modelos lingüísticos grandes, alcanzó el primer puesto en las listas de aplicaciones gratuitas de la App Store de China y Estados Unidos, superando a ChatGPT.
Este logro no solo atrajo la atención del mercado, sino que también tuvo un impacto significativo en el precio de las acciones de Nvidia, líder en chips de IA. A pesar de ello, un portavoz de Nvidia elogió a DeepSeek, calificándola como un avance excepcional en el campo de la IA, y señaló que el trabajo de DeepSeek demuestra cómo utilizar la técnica de escalamiento en tiempo de prueba, modelos ampliamente disponibles y recursos informáticos que cumplen con los controles de exportación para crear nuevos modelos.
El portavoz de Nvidia añadió que el proceso de inferencia requiere una gran cantidad de GPU de Nvidia y una red de alta velocidad. Nvidia actualmente domina tres leyes de escalamiento: el preentrenamiento y postentrenamiento continuos, y la nueva técnica de escalamiento en tiempo de prueba. Esta declaración también implica que las GPU utilizadas por DeepSeek cumplen totalmente con las regulaciones de exportación de Estados Unidos.
La técnica de escalamiento en tiempo de prueba es un tema muy debatido en los últimos años. Indica que si un modelo de IA completamente entrenado recibe más recursos informáticos durante la predicción, la generación de texto o imágenes para ayudar en su razonamiento, el modelo producirá respuestas de mayor calidad. Esta técnica ya se ha aplicado en modelos como el o1 de OpenAI.
El 27 de enero, los tres principales índices bursátiles de Estados Unidos cerraron con resultados mixtos. El precio de las acciones de Nvidia se desplomó un 16,86%, cerrando a 118,58 dólares por acción, su nivel más bajo en los últimos 10 meses. La capitalización de mercado de Nvidia, de 2,90 billones de dólares, se evaporó en 5900 millones de dólares en un solo día, estableciendo un nuevo récord de la mayor pérdida de valor de mercado diario para una sola acción. La caída de Nvidia también provocó una reducción significativa en la fortuna de su fundador, Jensen Huang, de 21.000 millones de dólares.
Liderado por Nvidia, el sector de los chips semiconductores de Estados Unidos sufrió un revés colectivo. DeepSeek, una empresa de modelos lingüísticos grandes perteneciente al gigante de la cuantificación Huángfāng Quantitativé, lanzó oficialmente su modelo de inferencia DeepSeek-R1 el 20 de enero. El R1 ha recibido una gran atención gracias a su excelente rendimiento, naturaleza de código abierto, y la reducción significativa de su precio y costes de entrenamiento. El coste de preentrenamiento del R1 fue de solo 5.576.000 dólares, completándose en 55 días en un clúster de 2048 GPU Nvidia H800.
Puntos clave:
📈 La aplicación DeepSeek llegó al primer puesto en las listas de aplicaciones gratuitas de la App Store de China y Estados Unidos.
💬 Nvidia calificó a DeepSeek como un avance excepcional en el campo de la IA, y su inferencia requiere una gran cantidad de GPU.
💸 El precio de las acciones de Nvidia cayó un 16,86%, perdiendo 5900 millones de dólares en un solo día, un récord histórico de pérdida diaria de valor de mercado para una sola acción.