Como os seis gigantes de modelos grandes estão reformulando suas estratégias sob o impacto do DeepSeek?

No último mês, o mercado global de modelos de linguagem grandes foi abalado pelo lançamento do DeepSeek, levando grandes empresas a se posicionarem e a elaborarem estratégias de resposta a essa nova força. No mercado interno, as seis startups de modelos de linguagem grandes que já se tornaram unicórnios — Zero One Wanwu, Baichuan Intelligence, Jieyue Xingchen, Zhipu Zhang, Yue Zhi Anmian e MiniMax — enfrentam desafios consideráveis, mas suas estratégias de resposta demonstram diferentes abordagens.

Primeiramente, o fundador da Zero One Wanwu, Kai-Fu Lee, declarou anteriormente que a empresa não mais buscaria o treinamento de modelos super grandes, focando em vez disso no desenvolvimento de modelos leves. Em 14 de fevereiro, a Zero One Wanwu e a Zona de Desenvolvimento de Alta Tecnologia de Suzhou uniram-se para estabelecer uma base de modelos de linguagem grandes para a indústria, concentrando-se em setores como manufatura, finanças e saúde, com o objetivo de levar a tecnologia de modelos de linguagem grandes do laboratório para aplicações práticas.

DeepSeek

Observação da imagem: Imagem gerada por IA, fornecedora de serviços de licenciamento de imagens Midjourney

Em poucos dias após o lançamento do DeepSeek, a Baichuan Intelligence lançou o modelo de raciocínio em todos os cenários Baichuan-M1-preview, com capacidades nas áreas de linguagem, visão e busca, e focou na transição para o setor de saúde, lançando o projeto “Médico Pediatra de IA”, demonstrando uma rápida implementação em aplicações práticas.

A Jieyue Xingchen optou por lançar dois novos modelos no mesmo dia do lançamento do DeepSeek, aumentando sua competitividade de mercado. Além disso, seu aplicativo “Yuewen” lançou novos recursos, com o objetivo de ajudar os usuários a desenvolver aplicativos sem código, melhorando ainda mais a experiência do usuário.

O fundador da Zhipu Zhang, Jie Tang, enfatizou em um fórum internacional que os futuros modelos de linguagem grandes serão essenciais para o dia a dia e o trabalho, realizando tarefas complexas por meio de aprendizado autônomo e colaboração humana, demonstrando sua visão de futuro.

A Yue Zhi Anmian lançou o modelo de raciocínio multimodal Kimi k1.5 pouco depois do lançamento do DeepSeek, para melhorar a capacidade de compreensão de contexto e otimização de estratégias do modelo, mostrando seu contínuo esforço em inovação tecnológica.

Embora essas seis startups não tenham respondido diretamente ao DeepSeek, suas ações práticas e inovações de produtos demonstram uma resposta ativa a esse impacto e sua capacidade de adaptação às mudanças de mercado.

Notícias e Informações de IA

Como os seis gigantes de modelos grandes estão reformulando suas estratégias sob o impacto do DeepSeek?

AIbase基地

Notícias de IA Relacionadas Recomendadas

Eficiência de modelos grandes em alta: tecnologia COMET do ByteDance é open-source, acelerando em 1,7 vezes

Arquitetura MLA do DeepSeek: Um novo avanço na migração de modelos grandes

Volcano Engine anuncia código aberto para aplicativos de modelos grandes: Laboratório de aplicativos de modelos grandes lançado para liberar o potencial de inovação da IA

Shenzhen lança plano de ação para inovação tecnológica em robôs inteligentes corporais, focando na construção de modelos grandes multimodais