Alors que l'intelligence artificielle (IA) bouleverse le secteur technologique mondial, un « vétéran » s'apprête à remonter sur scène. IBM a récemment publié un rapport de 28 pages intitulé « Les mainframes comme piliers de la transformation numérique », visant à démontrer l'importance incontournable de cette plateforme de calcul vieille de 60 ans à l'ère de l'IA. Rédigé par l'IBM Institute for Business Value, ce rapport présente non seulement l'état actuel des mainframes, mais décrit également leur rôle clé dans la transformation numérique axée sur l'IA.
Le rapport révèle que 79 % des responsables informatiques considèrent les mainframes comme essentielles à la réalisation d'innovations basées sur l'IA. Après 60 ans d'évolution, les mainframes sont devenues la pierre angulaire du stockage et du traitement de grandes quantités de données critiques pour l'entreprise. Alors que les organisations se lancent dans la transformation numérique axée sur l'IA, les mainframes joueront un rôle crucial dans la valorisation des données.
Source : Image générée par IA, fournisseur de services d'autorisation d'images Midjourney
IBM semble craindre que les utilisateurs de mainframes ne pensent que les charges de travail modernes de l'IA générative conviennent uniquement aux serveurs x86 et GPU du cloud public et/ou des centres de données. Par conséquent, le rapport souligne l'importance des mainframes dans ce domaine. IBM propose une approche hybride combinant les mainframes, le cloud public et l'edge computing, permettant de choisir la plateforme la plus appropriée en fonction des caractéristiques de la charge de travail.
Le rapport recommande aux utilisateurs de mainframes d'« utiliser l'IA pour obtenir des informations sur les transactions afin d'améliorer les cas d'utilisation, notamment la détection des fraudes, la lutte contre le blanchiment d'argent, les décisions de crédit, les recommandations de produits, la tarification dynamique et l'analyse des sentiments ». Un exemple frappant est celui d'une banque nord-américaine qui, en migrant son application de notation des transactions par carte de crédit vers un mainframe, a augmenté sa capacité de traitement de 20 % de transactions traitées en 80 ms par seconde à 15 000 transactions traitées en 2 ms par seconde, atteignant ainsi une notation de 100 % des transactions et réalisant des économies d'environ 20 millions de dollars par an en matière de prévention de la fraude.
IBM souligne que les mainframes équipées d'accélérateurs IA embarqués sur puce « peuvent être étendues pour traiter des millions de requêtes d'inférence par seconde avec une latence extrêmement faible, ce qui est particulièrement important pour les cas d'utilisation de l'IA transactionnelle (comme la détection des fraudes aux paiements) ». IBM propose une méthode « d'IA intégrée » qui combine les modèles d'apprentissage automatique existants avec les nouveaux modèles linguistiques volumineux (LLM) afin d'améliorer la précision des prédictions.
Outre les applications commerciales, l'IA peut également servir à améliorer la gestion des mainframes. Le rapport révèle que 74 % des dirigeants estiment qu'il est essentiel d'intégrer l'IA dans les opérations des mainframes et de transformer la gestion et la maintenance des systèmes. L'automatisation, l'analyse prédictive, l'auto-réparation et l'auto-optimisation basées sur l'IA peuvent détecter et prévenir proactivement les problèmes, optimiser les flux de travail et améliorer la fiabilité du système.
En matière de sécurité, les mainframes peuvent utiliser l'IA pour surveiller, analyser, détecter et répondre aux menaces cybernétiques. De plus, l'IA générative et les assistants de codage peuvent accélérer la conversion d'anciens langages de programmation (comme le COBOL) vers Java et le développement JCL, « réduisant ainsi le déficit de compétences en matière de mainframes en permettant aux développeurs de moderniser ou de créer des applications plus rapidement et plus efficacement ».
IBM adopte une méthode de déchargement du traitement de l'IA pour sa mainframe de nouvelle génération, la z16 (dont le lancement est prévu pour 2025), équipée d'unités de traitement de données IA (DPU) dédiées. La nouvelle génération de mainframes sera équipée de jusqu'à 32 processeurs Telum II, dotés d'une capacité d'accélération de l'inférence IA sur puce, à une vitesse de 24 TOPS. L'accélérateur Spyre ajoutera 32 cœurs d'accélération IA et 1 Go de DRAM, offrant des performances comparables à celles de l'accélérateur IA sur puce Telum II.
Cependant, IBM ne mentionne pas de projet d'ajout de GPU à son architecture de mainframe. Les charges de travail d'inférence fonctionneront efficacement sur les mainframes, mais ce n'est pas le cas des charges de travail d'entraînement de l'IA. On peut s'attendre à ce qu'IBM prévoie des fonctionnalités de vectorisation et de bases de données vectorielles pour les mainframes afin de prendre en charge la génération augmentée par la recherche (RAG) dans les charges de travail d'inférence.
Pour ce commentateur, l'ajout de GPU aux mainframes serait une percée de type « saint Graal », car cela ouvrirait la voie à l'exécution de charges de travail d'entraînement de l'IA sur cette plateforme de calcul classique. Peut-être que cette idée, à savoir un coprocesseur GPU, sera une caractéristique de la génération de mainframes z17.