Récemment, Inflection AI a pris une décision remarquable concernant sa nouvelle plateforme entreprise : abandonner les GPU Nvidia au profit des accélérateurs Gaudi3 d’Intel. Ce changement marque un ajustement stratégique de la société dans le domaine de l’IA, alors que son application client « Pi » fonctionnait auparavant sur des GPU Nvidia. Désormais, Inflection3.0 s’appuiera sur Gaudi3, les utilisateurs ayant le choix entre une exécution locale ou sur le cloud Tiber AI Cloud.

Puce IA dessin (1)

Source : Image générée par IA, fournisseur de services d’autorisation d’images Midjourney

Inflection AI, fondée en 2022, s’était initialement concentrée sur le développement de Pi, un assistant personnel conversationnel. Cependant, suite au départ de ses fondateurs Mustafa Suleyman et Karén Simonyan pour Microsoft au printemps, l’entreprise a commencé à se concentrer sur la création de modèles d’IA personnalisés pour les entreprises, en utilisant les données des clients pour améliorer la qualité du service.

Inflection3.0 est la dernière version de cette plateforme. Elle vise à créer des applications IA sur mesure pour les entreprises en affinant les modèles à l’aide de jeux de données propriétaires. Il est intéressant de noter qu’Intel sera l’un des premiers clients à utiliser ce service, ce qui laisse supposer qu’Inflection ne paiera peut-être pas le prix fort pour ces accélérateurs.

Bien qu’Inflection prévoit d’exécuter ses services sur des accélérateurs Gaudi3, la mise en place du système ne sera pas rapide. Comme avec Inflection2.5, la dernière version fonctionnera également sur le service Tiber AI Cloud d’Intel. Cependant, Inflection étant consciente que certains clients souhaitent conserver leurs données localement, elle prévoit de proposer des systèmes physiques basés sur les accélérateurs Intel IA à partir du premier trimestre 2025.

L’utilisation des accélérateurs Gaudi3 offre à Inflection une amélioration significative du rapport prix-performances. Sean White, PDG d’Inflection AI, a déclaré dans un billet de blog que l’utilisation de la technologie d’Intel leur a permis de constater une amélioration du rapport prix-performances pouvant atteindre le double par rapport aux produits concurrents actuels. Gaudi3 est également considéré comme plus rapide et moins coûteux que le H100 de Nvidia, tant pour l’entraînement que pour l’inférence.

Les spécifications techniques de Gaudi3 sont également impressionnantes, avec 128 Go de mémoire HBM2e, une bande passante allant jusqu’à 3,7 Tbps et des performances de 1 835 téraFLOPS en FP8 ou BF16 dense. En précision 16 bits, les performances en virgule flottante de Gaudi3 sont presque le double de celles du H100, ce qui est crucial pour les charges de travail d’entraînement et d’ajustement précis sur lesquelles Inflection se concentre.

De plus, Intel a récemment annoncé qu’IBM déploierait des accélérateurs Gaudi3 sur sa plateforme cloud, avec un lancement prévu début 2025. Cela signifie que les accélérateurs Gaudi3 gagnent progressivement en reconnaissance sur le marché.

Points clés :

🌟 Inflection AI décide d’abandonner les GPU Nvidia au profit des accélérateurs Gaudi3 d’Intel.

🚀 Inflection3.0 sera basé sur Gaudi3 et offrira des applications IA personnalisées aux entreprises.

💰 Grâce à Gaudi3, Inflection AI a réalisé une amélioration du rapport prix-performances pouvant atteindre le double.