Recentemente, a empresa de IA DeepSeek, localizada em Hangzhou, lançou seu mais recente modelo de linguagem grande - V3. Este modelo de código aberto apresentou desempenho próximo ao do modelo 4o da OpenAI e ao Claude 3.5 Sonnet da Anthropic em vários testes de referência, impressionando a indústria. Em comparação com os investimentos de centenas de milhões de dólares de suas contrapartes americanas, o custo total do modelo V3 da DeepSeek foi de apenas US$ 5,6 milhões, uma diferença significativa que chama a atenção.

Modelo Grande Metaverso (1)

Observação da Fonte: Imagem gerada por IA, provedor de serviços de licenciamento de imagens Midjourney

Liang Wenfeng, CEO da DeepSeek, afirmou que o financiamento nunca foi um problema para eles. Apesar do V3 ter sido treinado com chips H800, a equipe da DeepSeek conseguiu demonstrar uma forte capacidade de pesquisa e engenharia com recursos limitados.

O pioneiro da área de IA, Andrej Karpathy, comentou sobre isso dizendo que o orçamento de investimento da DeepSeek é "uma piada", mas o resultado final é "uma pesquisa e engenharia impressionantemente altas com restrições de recursos".

A IAG (Inteligência Artificial Geral) é considerada o "santo graal" da pesquisa em IA, capaz de superar os humanos na resolução de problemas e na execução de tarefas. Especialistas preveem que, uma vez que a tecnologia amadureça, o primeiro país a alcançar a IAG terá uma enorme vantagem econômica, científica e de segurança.