DeepSeek ha abierto una cuenta oficial en Zhihu y publicado el artículo técnico «Descripción general del sistema de inferencia DeepSeek-V3/R1», revelando por primera vez detalles de optimización de su sistema de inferencia de modelos e información sobre la relación costo-beneficio. Esto marca el final de la muy esperada «Semana de código abierto de DeepSeek».

DeepSeek

El artículo presenta dos objetivos principales de optimización del sistema de inferencia DeepSeek-V3/R1: «mayor rendimiento y menor latencia». Para lograr estos objetivos, DeepSeek ha empleado la tecnología de paralelismo de expertos a gran escala entre nodos (EP), a pesar del aumento de la complejidad del sistema. El artículo destaca cómo se utiliza la tecnología EP para aumentar el tamaño del lote, ocultar el tiempo de transmisión y lograr un equilibrio de carga.

Cabe destacar que DeepSeek ha publicado, excepcionalmente, sus datos de costos y márgenes de beneficio. El artículo revela: «Suponiendo un costo de alquiler de GPU de 2 dólares/hora, el costo total es de 87.072 dólares/día. Si todos los tokens se calculan según el precio de DeepSeek R1, teóricamente, los ingresos totales diarios serían de 562.027 dólares, con un margen de beneficio del 545 %».