Hoje, na conferência Create2025 AI Developers Conference da Baidu em Wuhan, o fundador Robin Li fez um discurso de quase 60 minutos com o tema "O mundo dos modelos, o reino das aplicações", lançando oficialmente as versões 4.5 Turbo e X1 Turbo do modelo de linguagem Ernie, e revelando o progresso e os desafios existentes da implantação do modelo DeepSeek no ecossistema da Baidu.

Li revelou que produtos principais da Baidu, como Wenxinyan, busca do Baidu e mapa do Baidu, já integraram o modelo DeepSeek completo, melhorando a eficiência em cenários como atendimento ao cliente inteligente e aprimoramento da busca. No entanto, ele também admitiu que o DeepSeek ainda apresenta limitações técnicas: "O modelo suporta apenas processamento de texto, não podendo gerar conteúdo multimídia como imagens, áudio e vídeo, enquanto mais de 60% dos clientes corporativos da nuvem inteligente da Baidu têm uma demanda clara por recursos multimodais". Ele usou o cenário de transmissão ao vivo de comércio eletrônico como exemplo, apontando que a alta taxa de alucinação do DeepSeek (ou seja, geração de informações incorretas) dificulta sua aplicação direta em áreas de alto risco como finanças e saúde. "Se uma promoção 'Compre um, leve dez' incorreta for transmitida durante uma transmissão ao vivo, o comerciante enfrentará perdas incontroláveis". Além disso, a lentidão e o alto custo de chamada também limitam sua implantação em larga escala - atualmente, a maioria dos custos de chamada da API de grandes modelos no mercado chinês é menor que a versão completa do DeepSeek, e a velocidade de resposta é mais rápida.

O algoritmo do modelo de linguagem de grande porte DeepSeek é uma busca profunda pela IA de inteligência artificial

Para resolver esses problemas, as duas versões do modelo de linguagem Ernie lançadas pela Baidu desta vez apresentam três direções de atualização: multimídia, raciocínio forte e baixo custo. Li enfatizou que a multimídia se tornou o "ingresso" para os modelos de IA de próxima geração. "A participação de mercado de modelos de texto puro diminuirá aceleradamente, e as empresas precisam de modelos gerais que possam processar simultaneamente texto, imagens, áudio e vídeo". Em termos de desempenho, o preço de entrada do Ernie 4.5 Turbo é reduzido para 0,8 yuan por milhão de tokens, e o preço de saída é de 3,2 yuan, com uma velocidade de inferência duas vezes mais rápida e um custo 80% menor em comparação com a geração anterior; o preço de entrada da versão X1 Turbo é de 1 yuan e o preço de saída é de 4 yuan, com um aumento de desempenho e uma redução de preço de 50%, além de suporte para otimização de inferência bilíngue chinês-inglês e em setores verticais como jurídico e médico.

“O custo é o principal obstáculo para a explosão de aplicações de IA.” Li afirmou diretamente que o maior obstáculo para os desenvolvedores construírem aplicativos de IA atualmente é o alto custo da capacidade de computação, e a essência da inovação tecnológica muitas vezes vem da ruptura da estrutura de custos. Ele usou a condução autônoma como exemplo, apontando que o preço de um LiDAR era superior a US$ 100.000 em 2015, mas agora caiu para a faixa de milhares de dólares, impulsionando diretamente a popularização da tecnologia de nível 4. A redução de preços do modelo de linguagem Ernie desta vez visa reduzir a barreira de entrada para as empresas, "permitindo que pequenas e médias empresas possam usar grandes modelos, permitindo que empreendedores se atrevem a experimentar e, finalmente, dando origem a aplicativos nativos de IA em todos os setores".

De acordo com a equipe técnica da Baidu, as versões Ernie 4.5 Turbo e X1 Turbo já estão disponíveis na nuvem pública e implantação privada, com suporte para chamadas sob demanda e treinamento personalizado. A análise de mercado acredita que a Baidu, por meio da iteração tecnológica e da reconstrução de custos, está tentando encontrar um ponto de equilíbrio entre a capacidade do modelo e a implementação comercial, e a capacidade multimídia e a vantagem de preço podem se tornar seus trunfos-chave para competir por clientes corporativos.