Avec le développement rapide de l'intelligence artificielle (IA), de l'apprentissage automatique (ML) et du calcul haute performance (HPC) dans divers secteurs, AMD a récemment lancé ROCm 6.3, une plateforme open source conçue pour les accélérateurs GPU AMD Instinct, afin de relever les défis posés par ces charges de travail. Ce lancement vise à aider les développeurs à répondre aux besoins en ressources de calcul, en gestion de la mémoire et en optimisation des logiciels, améliorant ainsi leur efficacité.

ROCm 6.3 intègre de nombreux outils et fonctionnalités d'optimisation avancés, cherchant à trouver un équilibre entre performances et convivialité pour les développeurs. Le support du langage SGLang rend l'inférence IA plus efficace, permettant l'exécution fluide de modèles complexes. De plus, la refonte de FlashAttention-2 résout efficacement les goulots d'étranglement de performance dans les processus d'entraînement et d'inférence de l'IA, augmentant considérablement la vitesse d'exécution.

Dans le domaine du calcul haute performance, ROCm 6.3 ajoute la prise en charge de la FFT multinœuds, optimise la transformée de Fourier rapide dans les systèmes distribués et améliore l'extensibilité des flux de travail HPC. Pour les tâches de vision par ordinateur, la bibliothèque de vision par ordinateur améliorée fournit des algorithmes optimisés, améliorant les performances de la détection d'objets et du traitement d'images. Le compilateur AMD Fortran permet aux utilisateurs de connecter d'anciennes bibliothèques de code à l'accélération GPU, offrant une solution simple pour les applications de calcul scientifique.

ROCm 6.3 est conçu pour répondre aux besoins du calcul moderne, et ses optimisations sont significatives. Les retours utilisateurs montrent que l'intégration de FlashAttention-2 a amélioré l'efficacité de l'entraînement des modèles Transformer de près de 30 %, tandis que la prise en charge de la FFT multinœuds permet aux chercheurs d'obtenir d'excellents résultats lors du traitement de données à grande échelle, réduisant les coûts de calcul.

De plus, la bibliothèque de vision par ordinateur améliorée a considérablement accéléré le temps d'inférence des tâches de reconnaissance d'images, ce qui se traduit par une réduction des cycles de développement et une meilleure précision des résultats des applications. En tant que plateforme open source, ROCm 6.3 peut être mis à jour en permanence, et les contributions de la communauté l'aideront à rester compatible avec les nouvelles technologies.

En intégrant de nombreuses fonctionnalités et optimisations, ROCm 6.3 fournit aux développeurs et aux organisations un ensemble d'outils fiables, répondant aux besoins informatiques en constante évolution. Sa conception open source et le support communautaire en font une plateforme idéale pour les charges de travail IA, ML et HPC.

Lien : https://community.amd.com/t5/ai/unlocking-new-horizons-in-ai-and-hpc-with-the-release-of-amd/ba-p/726434

Points clés :

🌟 ROCm 6.3 est une plateforme open source d'AMD pour les charges de travail IA, ML et HPC, offrant de nombreux outils et optimisations avancés.

🚀 FlashAttention-2 améliore l'efficacité de l'entraînement des modèles Transformer, et la prise en charge de la FFT multinœuds améliore l'extensibilité des flux de travail HPC.

🖼️ La bibliothèque de vision par ordinateur améliorée et le compilateur AMD Fortran offrent aux développeurs des outils plus efficaces, facilitant l'intégration d'anciens codes avec l'accélération GPU.