A Cerebras Systems anunciou recentemente a construção de seis novos data centers na América do Norte e na Europa para aumentar sua capacidade de inferência de inteligência artificial (IA). Essa iniciativa aumentará significativamente a capacidade de computação da empresa, apoiando o desenvolvimento de diversos aplicativos de IA.

De acordo com o plano, 85% da capacidade computacional estará concentrada nos Estados Unidos, com três instalações já em operação em Santa Clara e Stockton, na Califórnia, e Dallas, no Texas. Os novos centros serão abertos em Minneapolis (previsto para o segundo trimestre de 2025), Oklahoma City e Montreal (previsto para o terceiro trimestre de 2025), e Atlanta e na França (previsto para o quarto trimestre de 2025).

Supercomputador Centro de Dados (3)

Observação da fonte: Imagem gerada por IA, fornecedora de serviços de licenciamento de imagens Midjourney

O núcleo dos novos data centers será o “Wafer Scale Engine” (WSE) desenvolvido pela Cerebras, uma arquitetura de chip especial otimizada para aplicativos de IA. A empresa afirma que seu sistema CS-3 consegue processar 40 milhões de tokens de modelo Llama-70B por segundo, aumentando significativamente a velocidade de processamento de tarefas de inferência. A instalação em Oklahoma City terá mais de 300 sistemas CS-3. O centro foi construído com o padrão Tier III +3, com capacidade de resistir a tornados e terremotos, e conta com fonte de alimentação triplamente redundante, com previsão de início de operação em junho de 2025.

Atualmente, várias empresas de IA de renome assinaram acordos de parceria com a Cerebras, incluindo a startup francesa Mistral e seu assistente Le Chat, e o mecanismo de perguntas e respostas de IA Perplexity. HuggingFace e AlphaSense também se juntaram ao uso da plataforma Cerebras. Essa tecnologia é especialmente adequada para modelos de inferência que exigem cálculos prolongados e geração de grandes quantidades de tokens, como Deepseek-R1 e OpenAI o3.

Essa expansão faz parte da estratégia de expansão geral da Cerebras para 2025, e algumas instalações serão operadas em parceria com a empresa dos Emirados Árabes Unidos G42. Em Montreal, o novo centro, gerenciado pela Enovum, subsidiária da Bit Digital, deve entrar em operação em julho de 2025, com velocidade de inferência dez vezes maior que a das GPUs atuais.

A Cerebras Systems é uma empresa americana focada no desenvolvimento de chips de IA. Seu conceito de design único consiste em usar toda a pastilha como um único chip. A empresa já lançou a terceira geração do WSE, o WSE-3. O sistema já é usado em instituições como o Laboratório Nacional de Argonne, o Centro de Supercomputação de Pittsburgh e a GlaxoSmithKline. Apesar das vantagens de sua tecnologia, existem algumas limitações, como a falta de suporte nativo para CUDA (o padrão da Nvidia) e a menor compatibilidade de servidores em comparação com as soluções da Nvidia.

Destaques:

🌍 A Cerebras planeja construir seis novos data centers na América do Norte e na Europa, com foco nos Estados Unidos, com previsão de operação completa em 2025.   

⚡ Os data centers utilizarão chips de pastilha única exclusivos, com capacidade de processar 40 milhões de tokens por segundo.   

🤝 Várias empresas de IA de renome firmaram parcerias com a Cerebras para aproveitar sua capacidade de inferência de alta velocidade.