Recentemente, engenheiros do Meta desabafaram anonimamente no TeamBlind, revelando a imensa pressão causada pelo modelo de IA R1, desenvolvido pela empresa chinesa DeepSeek. A DeepSeek é considerada a criadora do primeiro modelo de IA de código aberto mundial comparável ao modelo o1 da OpenAI. Comparado à OpenAI, o R1 não apenas possui um código aberto ainda mais amplo, mas também um custo de treinamento surpreendentemente baixo: apenas US$ 5,5 milhões.
Em contraste, o salário anual de executivos do Meta frequentemente supera o custo total de treinamento do DeepSeek V3, causando grande constrangimento à administração do Meta.
De acordo com informações internas, o surgimento do DeepSeek V3 já havia gerado considerável pressão sobre o Meta no ano passado. Os engenheiros do Meta estão trabalhando arduamente para analisar a tecnologia da DeepSeek e replicar suas tecnologias-chave o mais rápido possível. No passado, pesquisadores de IA em todo o mundo perseguiam os grandes modelos americanos. Agora, a situação mudou, e engenheiros americanos estão fazendo engenharia reversa da tecnologia de IA chinesa.
O DeepSeek não apenas superou o Llama4 do Meta em testes de referência, mas também chamou a atenção da indústria em várias áreas. A DeepSeek alcançou um desempenho de raciocínio excepcional por meio de técnicas como aprendizado por reforço em larga escala (RL) e ajuste fino sem supervisão (SFT). Essa demonstração de confiança tecnológica levou alguns internautas americanos a refletir sobre a rápida ascensão da China no campo da IA.
Pontos importantes:
🌟 O custo de treinamento do modelo DeepSeek R1 foi de apenas US$ 5,5 milhões, com desempenho comparável ao o1 da OpenAI.
👨💻 Os salários dos executivos do Meta excedem o custo de treinamento do DeepSeek, causando grande pressão sobre a administração.
📈 O sucesso da DeepSeek gerou pânico entre as empresas de tecnologia americanas, desafiando a liderança dos EUA na área de IA.