En meio à onda de inteligência artificial que varre a indústria tecnológica global, um "veterano" está se preparando para retornar ao palco. A IBM lançou recentemente um relatório de 28 páginas intitulado "Mainframes como força motriz da transformação digital", buscando provar que essa plataforma de computação de 60 anos continua indispensável na era da IA. O relatório, elaborado pelo IBM Institute for Business Value, não apenas apresenta o estado atual dos mainframes, mas também descreve seu papel crucial na transformação digital impulsionada pela IA.

O relatório mostra que 79% dos executivos de TI consideram os mainframes essenciais para a inovação impulsionada pela IA. Após 60 anos de evolução, os mainframes se tornaram a força motriz no armazenamento e processamento de grandes volumes de dados críticos para os negócios. À medida que as organizações embarcam na jornada de transformação digital impulsionada pela IA, os mainframes desempenharão um papel fundamental na maximização do valor dos dados.

Datacenter (1) Servidores

Nota da imagem: Imagem gerada por IA, provedor de serviços de licenciamento de imagens Midjourney

A IBM parece temer que os usuários de mainframes possam acreditar que as cargas de trabalho modernas de IA generativa são adequadas apenas para a nuvem pública e/ou servidores x86 e GPU em data centers. Portanto, o relatório destaca a importância dos mainframes nessa área. A IBM propõe uma abordagem híbrida, combinando mainframes, nuvem pública e computação de borda, escolhendo a plataforma mais adequada de acordo com as características da carga de trabalho.

O relatório recomenda aos usuários de mainframes que "aproveitem a IA para obter insights de transações, a fim de aprimorar casos de uso de negócios, incluindo detecção de fraudes, anti-lavagem de dinheiro, decisões de crédito, recomendações de produtos, precificação dinâmica e análise de sentimentos". Um caso notável é o de um banco norte-americano que, ao migrar seu aplicativo de classificação de transações de cartão de crédito para um mainframe, aumentou sua capacidade de processamento de 20% das transações a 80 milissegundos por segundo para 15.000 transações a 2 milissegundos por segundo, alcançando 100% de classificação de transações e economizando cerca de US$ 20 milhões anualmente em prevenção de fraudes.

A IBM destaca que os mainframes equipados com aceleradores de IA integrados em chip "podem ser dimensionados para processar milhões de solicitações de inferência por segundo, com latência extremamente baixa, o que é especialmente importante para casos de uso de IA transacional (como a detecção de fraudes em pagamentos)". A IBM propõe um método de "IA integrada", combinando modelos de aprendizado de máquina existentes com novos modelos de linguagem grandes (LLMs) para melhorar a precisão das previsões.

Além dos aplicativos de negócios, a IA também pode ser usada para melhorar a administração de mainframes. O relatório descobriu que 74% dos executivos consideram crucial integrar a IA às operações de mainframes e transformar a maneira como os sistemas são gerenciados e mantidos. A automação impulsionada por IA, a análise preditiva, a auto-reparação e os recursos de auto-ajuste podem detectar e prevenir problemas proativamente, otimizar fluxos de trabalho e melhorar a confiabilidade do sistema.

Em termos de segurança, os mainframes podem usar IA para monitorar, analisar, detectar e responder a ameaças cibernéticas. Além disso, a IA generativa e os assistentes de código podem acelerar a conversão de linguagens de programação antigas (como COBOL) para Java e o desenvolvimento de JCL, "reduzindo a lacuna de habilidades de mainframes, permitindo que os desenvolvedores modernizem ou criem aplicativos de forma mais rápida e eficiente".

A IBM está adotando uma abordagem de descarregamento de processamento de IA para seu mainframe de próxima geração, o z16 (previsto para lançamento em 2025), com unidades de processamento de dados (DPUs) de IA dedicadas. A próxima geração de mainframes será equipada com até 32 processadores Telum II, com capacidade de aceleração de inferência de IA integrada em chip, a uma taxa de 24 TOPS. O acelerador Spyre adicionará 32 núcleos de aceleração de IA e 1 GB de DRAM, com desempenho comparável ao acelerador de IA integrado em chip Telum II.

No entanto, a IBM não mencionou planos para adicionar GPUs à sua arquitetura de mainframe. As cargas de trabalho de inferência funcionarão de forma eficiente em mainframes, mas as cargas de trabalho de treinamento de IA não. Podemos esperar que a IBM adicione recursos de vetorização e bancos de dados vetoriais aos mainframes para suportar a recuperação aprimorada de geração (RAG) em cargas de trabalho de inferência.

Para este comentarista, adicionar GPUs aos mainframes seria um avanço "santo graal", pois abriria as portas para executar cargas de trabalho de treinamento de IA nesta plataforma de computação clássica. Talvez essa ideia, ou seja, um coprocessador GPU, seja uma característica da geração de mainframes z17.