DeepSeek R1 chega, executivos do Meta estão em pânico

AIbase基地

Publicado emNotícias e Informações de IA · 4 minutos de leitura · Jan 24, 2025

329

Recentemente, engenheiros do Meta desabafaram anonimamente no TeamBlind, revelando a imensa pressão causada pelo modelo de IA R1, desenvolvido pela empresa chinesa DeepSeek. A DeepSeek é considerada a criadora do primeiro modelo de IA de código aberto mundial comparável ao modelo o1 da OpenAI. Comparado à OpenAI, o R1 não apenas possui um código aberto ainda mais amplo, mas também um custo de treinamento surpreendentemente baixo: apenas US$ 5,5 milhões.

Em contraste, o salário anual de executivos do Meta frequentemente supera o custo total de treinamento do DeepSeek V3, causando grande constrangimento à administração do Meta.

De acordo com informações internas, o surgimento do DeepSeek V3 já havia gerado considerável pressão sobre o Meta no ano passado. Os engenheiros do Meta estão trabalhando arduamente para analisar a tecnologia da DeepSeek e replicar suas tecnologias-chave o mais rápido possível. No passado, pesquisadores de IA em todo o mundo perseguiam os grandes modelos americanos. Agora, a situação mudou, e engenheiros americanos estão fazendo engenharia reversa da tecnologia de IA chinesa.

O DeepSeek não apenas superou o Llama4 do Meta em testes de referência, mas também chamou a atenção da indústria em várias áreas. A DeepSeek alcançou um desempenho de raciocínio excepcional por meio de técnicas como aprendizado por reforço em larga escala (RL) e ajuste fino sem supervisão (SFT). Essa demonstração de confiança tecnológica levou alguns internautas americanos a refletir sobre a rápida ascensão da China no campo da IA.

Pontos importantes:
🌟 O custo de treinamento do modelo DeepSeek R1 foi de apenas US$ 5,5 milhões, com desempenho comparável ao o1 da OpenAI.
👨‍💻 Os salários dos executivos do Meta excedem o custo de treinamento do DeepSeek, causando grande pressão sobre a administração.
📈 O sucesso da DeepSeek gerou pânico entre as empresas de tecnologia americanas, desafiando a liderança dos EUA na área de IA.

Serviço de recarga da API da plataforma aberta DeepSeek já foi oficialmente retomado

Com a retomada da recarga, a DeepSeek também ajustou o preço de chamada de alguns modelos. O período promocional do modelo deepseek-chat terminou, e o preço de chamada do modelo V3 em que se baseia foi ajustado para 2 yuans por milhão de tokens de entrada e 8 yuans por milhão de tokens de saída. Já o preço de chamada do modelo deepseek-reasoner, baseado no modelo R1, é de 4 yuans por milhão de tokens de entrada e 16 yuans por milhão de tokens de saída.

Executivos do Google respondem à reversão do compromisso com IA de armas e metas de diversidade, causando indignação entre funcionários!

Em uma recente reunião de todos os funcionários, executivos do Google detalharam a decisão da empresa de abandonar as metas de diversidade e inclusão (D&I) e seu compromisso de não desenvolver inteligência artificial para fins bélicos. Melonie Parker, ex-chefe de diversidade do Google, afirmou que a empresa interromperá os programas de treinamento de D&I para funcionários e “atualizará” outros treinamentos relacionados. Esta é a primeira resposta a todos os funcionários desde que o Google anunciou que não estabeleceria mais metas de contratação para diversidade. O advogado-chefe do Google, Kent Walker, disse que, desde que a empresa apresentou pela primeira vez sua AI Princ

Estudo alerta para os limites dos modelos de linguagem de IA: desempenho reduzido à metade com contexto superior a 8K, raciocínio conceitual se torna um desafio

Uma pesquisa recente realizada pela Universidade de Munique, o Centro de Aprendizado de Máquina de Munique e a Adobe Research mostra que 12 modelos de linguagem de IA de ponta, incluindo GPT-4o, Gemini1.5Pro e Llama-3.3-70B, enfrentam uma redução significativa de desempenho em tarefas de raciocínio conceitual com texto longo. Embora esses modelos suportem o processamento de contexto de pelo menos 128.000 tokens, sua capacidade de ligação lógica profunda ainda apresenta limitações fundamentais. A equipe de pesquisa desenvolveu o NOLIMA (sem correspondência de texto)

Usuários ativos mensais de aplicativos AIGC ultrapassam 100 milhões, com Doubao dominando metade do mercado

De acordo com os dados mais recentes da empresa de pesquisa QuestMobile, até o final de novembro de 2024, os usuários ativos mensais de aplicativos AIGC (conteúdo gerado por inteligência artificial) na China ultrapassaram 100 milhões. Entre eles, o Doubao, da ByteDance, se destacou, detendo metade do mercado graças à sua sólida base de usuários. Simultaneamente, o Wen Xiaoyan do Baidu e o Kimi, assistente inteligente desenvolvido pela Yue Zhi Anmian, também conquistaram espaço no mercado. Com o rápido crescimento dos aplicativos AIGC, a concentração de usuários em empresas líderes tende a aumentar.