O vice-presidente executivo do grupo Baidu, Shen Dou, anunciou hoje, na conferência Baidu Cloud Intelligence 2024, a atualização da plataforma de computação Baidu Baige 4.0. Esta nova versão suporta treinamento híbrido multicoração e adaptação multicoração, e alcançou mais de 99,5% de tempo de treinamento eficaz em um cluster de milhares de placas, melhorando significativamente a eficiência do uso da capacidade de computação.

No contexto atual de escassez de poder computacional, a atualização do Baige 4.0 ajudará as empresas a utilizar os recursos computacionais de forma mais eficiente, reduzindo os custos operacionais. O foco da atualização é melhorar a capacidade de "treinamento híbrido multicoração", alcançando 95% de eficiência de treinamento em um cluster de milhares de placas, atingindo o nível líder do setor.

QQ20240925-111958.png

Além disso, o Baige 4.0 também implementou implantação em segundos, reduzindo o tempo de preparação para operação de um cluster de milhares de placas de várias semanas para apenas 1 hora, melhorando muito a eficiência de implantação e encurtando o ciclo de lançamento do negócio. Para falhas frequentes durante o treinamento de grandes modelos, o Baige 4.0 atualizou os métodos de detecção de falhas e o mecanismo de tolerância a falhas automática, reduzindo efetivamente a frequência de ocorrência de falhas, diminuindo o tempo de tratamento de falhas e garantindo mais de 99,5% de tempo de treinamento eficaz.

Em termos de inferência de modelos, o Baige 4.0 otimizou a velocidade e o custo, especialmente na inferência de texto longo, com aumento de eficiência superior a 100%, atendendo às crescentes demandas do mercado.