La empresa emergente china DeepSeek (深度求索) ha llamado la atención mundial recientemente con su modelo de lenguaje grande (LLM) de IA generativa de alto rendimiento y bajo costo. El profesor Yutaka Matsuo de la Universidad de Tokio, una autoridad en investigación de IA en Japón, analizó en profundidad el nivel tecnológico de DeepSeek, su estrategia de código abierto y su impacto en las empresas japonesas en una entrevista con el Nikkei.

Matsuo afirmó que la tecnología de DeepSeek es excepcional, con un rendimiento comparable al de ChatGPT, desarrollado por OpenAI de Estados Unidos. Señaló que DeepSeek publica artículos técnicos detallados con cada nuevo modelo, mostrando sus innovaciones en la optimización del modelo. Por ejemplo, su último modelo "R1", lanzado en enero, mejoró su capacidad de razonamiento a través del aprendizaje por refuerzo, alcanzando un nivel comparable al modelo "o1" de OpenAI.

DeepSeek

Matsuo cree que el nivel de desarrollo de IA en China ya está a la par con el de Estados Unidos, e incluso lo supera en algunos aspectos. Destacó que China no solo cuenta con gigantes tecnológicos como Alibaba, Tencent y Baidu, sino también con una gran cantidad de ingenieros excelentes, lo que ha creado un ecosistema de IA dinámico. El surgimiento de DeepSeek en este entorno no es sorprendente y podría cambiar aún más el equilibrio de poder en la competencia mundial de IA.

Matsuo enfatizó que el éxito de DeepSeek ofrece una valiosa lección para las empresas emergentes japonesas. Como empresa que no es un gigante tecnológico, DeepSeek ha logrado una precisión líder en el mundo gracias a un sólido desarrollo tecnológico. Esto demuestra que incluso en Japón, las empresas pueden lograr avances en el campo de la IA si se centran en la innovación tecnológica.

DeepSeek ha adoptado una estrategia de código abierto, similar a la de empresas como Meta y Alibaba. Matsuo señaló que los modelos de código abierto proporcionan una base sólida para los desarrolladores de todo el mundo, facilitando el aprendizaje adicional y la mejora del rendimiento. Cree que la aparición de DeepSeek ha fortalecido la influencia del código abierto; aunque los modelos cerrados (como los productos de OpenAI y Google) siguen teniendo una ventaja competitiva, los modelos de código abierto también pueden lograr un rendimiento excepcional en escenarios específicos.

En cuanto a los riesgos de seguridad de los modelos de IA, Matsuo afirmó que los riesgos varían según el uso. Los modelos de código abierto se pueden ejecutar localmente, evitando el riesgo de fuga de datos; mientras que al utilizar servicios en línea, los datos se envían a un servidor para su procesamiento. Hizo hincapié en que, tanto para DeepSeek como para OpenAI, los usuarios deben confiar en el proveedor de servicios, ya que es difícil eliminar completamente el uso y el aprendizaje de los datos.