A DeepSeek (深度求索), uma startup chinesa, recentemente chamou a atenção global com seu modelo de linguagem grande (LLM) de IA generativa de alto desempenho e baixo custo. O Professor Matsuo Yutaka, uma autoridade em pesquisa de IA no Japão e professor da Universidade de Tóquio, analisou profundamente o nível tecnológico da DeepSeek, sua estratégia de código aberto e seu impacto em empresas japonesas em uma entrevista ao Nikkei.

Matsuo Yutaka afirmou que a tecnologia da DeepSeek é excepcional, com desempenho próximo ao ChatGPT, desenvolvido pela OpenAI dos EUA. Ele observou que a DeepSeek publica artigos técnicos detalhados a cada lançamento de um novo modelo, demonstrando suas inovações em otimização de modelos. Por exemplo, o modelo mais recente, "R1", lançado em janeiro deste ano, melhorou sua capacidade de raciocínio por meio de aprendizado por reforço, atingindo um nível comparável ao modelo "o1" da OpenAI.

DeepSeek

Matsuo Yutaka acredita que o nível de desenvolvimento de IA da China já se iguala ao dos EUA, e até mesmo o supera em alguns aspectos. Ele apontou que a China não só possui gigantes tecnológicos como Alibaba, Tencent e Baidu, mas também um grande número de engenheiros excelentes, formando um ecossistema de IA vibrante. O surgimento da DeepSeek nesse ambiente não é surpreendente e pode mudar ainda mais a dinâmica da competição global de IA.

Matsuo Yutaka enfatizou que o sucesso da DeepSeek oferece importantes lições para startups japonesas. Sendo uma empresa que não é uma grande tecnológica, a DeepSeek alcançou precisão de ponta mundial por meio de um desenvolvimento tecnológico sólido. Isso mostra que, mesmo no Japão, as empresas podem alcançar avanços no campo da IA se se concentrarem na inovação tecnológica.

A DeepSeek adotou uma estratégia de código aberto, semelhante à de empresas como Meta e Alibaba. Matsuo Yutaka observou que os modelos de código aberto fornecem uma base poderosa para desenvolvedores globais, facilitando o aprendizado adicional e a melhoria do desempenho. Ele acredita que o surgimento da DeepSeek fortaleceu a influência do código aberto. Embora modelos não abertos (como os produtos da OpenAI e Google) ainda mantenham uma vantagem competitiva, os modelos de código aberto também podem atingir um desempenho excepcional em cenários específicos.

Sobre os riscos de segurança dos modelos de IA, Matsuo Yutaka disse que os riscos variam de acordo com a forma de uso. Os modelos de código aberto podem ser executados localmente, evitando o risco de vazamento de dados; enquanto o uso de serviços online envia os dados para servidores para processamento. Ele enfatizou que, tanto para a DeepSeek quanto para a OpenAI, os usuários precisam confiar nos provedores de serviços, pois o uso e o aprendizado de dados são difíceis de serem totalmente excluídos.