Red Hat lance la version 1.3 de RHEL AI : prise en charge de Granite LLM et d'Intel Gaudi 3

AIbase基地

Publié leActualités IA · 6 minutes de lecture · Dec 13, 2024

163

Red Hat a récemment publié la version 1.3 de sa plateforme d'intelligence artificielle Linux d'entreprise, RHEL AI. Cette version inclut une prise en charge accrue du modèle linguistique de grande taille (LLM) IBM Granite, ainsi qu'un aperçu de la prise en charge des accélérateurs Intel Gaudi3. Cette mise à jour offre de nouvelles opportunités aux partenaires de services et intégrateurs systèmes Red Hat, aidant les entreprises à explorer et à intégrer plus efficacement les applications d'intelligence artificielle.

Joe Fernandes, vice-président et directeur général de la division IA de Red Hat, a déclaré que les partenaires de services et les intégrateurs systèmes jouent un rôle essentiel pour aider les entreprises à mettre en œuvre différents cas d'utilisation. Il a souligné que la complexité de l'intelligence artificielle générative permet à ces partenaires de fournir des solutions plus rentables aux clients. Red Hat vise à réduire les coûts en utilisant des modèles plus petits, à simplifier la complexité de l'intégration des modèles avec les données client et les cas d'utilisation, et à offrir la flexibilité nécessaire pour déployer ces modèles dans des environnements hybrides.

RHEL AI version 1.3 est conçue pour le développement, les tests et l'exécution de modèles d'intelligence artificielle générative pour les applications d'entreprise. Cette mise à jour inclut la prise en charge du modèle linguistique de grande taille IBM Granite sous licence open source, tout en utilisant des technologies open source pour la préparation des données. Les utilisateurs peuvent créer des images RHEL packageables et amorçables pour le déploiement sur des serveurs individuels dans un cloud hybride grâce au projet d'alignement de modèles InstructLab développé conjointement avec IBM.

La nouvelle version prend en charge les cas d'utilisation en anglais du modèle Granite 3.08b et offre un aperçu développeur permettant aux utilisateurs d'expérimenter les capacités du modèle dans d'autres langues, la génération de code et les appels de fonctions. Ces fonctionnalités seront entièrement prises en charge dans les versions ultérieures. De plus, RHEL AI prend en charge le projet open source Docling d'IBM Research, capable de convertir des formats de documents courants en Markdown, JSON, etc., pour une utilisation dans les applications et l'entraînement de l'intelligence artificielle générative. La nouvelle version possède une capacité de segmentation contextuelle, tenant compte de la structure et des éléments sémantiques du document, afin d'améliorer la qualité des réponses de l'intelligence artificielle générative.

Cette publication inclut également un aperçu technique de la prise en charge des accélérateurs Intel Gaudi3, permettant aux utilisateurs de traiter plusieurs requêtes en parallèle dans le traitement en temps réel et d'ajuster dynamiquement les paramètres du LLM pendant le traitement. Les futures versions de RHEL AI prendront en charge davantage de formats de documents pour Docling, intégreront un pipeline de génération de recherche améliorée et les fonctionnalités d'optimisation des connaissances d'InstructLab.

Points clés :
🔹 RHEL AI version 1.3 ajoute la prise en charge du modèle linguistique de grande taille IBM Granite, améliorant les capacités des applications d'entreprise.
🔹 La nouvelle version offre un aperçu de la prise en charge des accélérateurs Intel Gaudi3, améliorant les capacités de traitement en temps réel.
🔹 Red Hat s'engage à réduire les coûts et la complexité des modèles d'intelligence artificielle, favorisant un déploiement flexible dans le cloud hybride.

Rapport Deloitte : 74 % des entreprises ont atteint ou dépassé le retour sur investissement de l'IA générative

À l'échelle mondiale, les entreprises de tous types s'efforcent de comprendre l'intelligence artificielle générative (IA générative) et d'explorer sa valeur potentielle. Selon un récent rapport de Deloitte sur l'état de l'intelligence artificielle générative, la plupart des organisations obtiennent en fait de bons résultats en matière de retour sur investissement. Ce rapport, basé sur une enquête menée auprès de 2 773 dirigeants dans 14 pays, révèle les progrès et les défis des organisations en matière d'application de l'intelligence artificielle générative. Légende de l'image : Image générée par IA, fournisseur de services d'autorisation d'images Midjourney.

238 services d'intelligence artificielle générative enregistrés auprès du Cyberspace Administration of China en 2024

Le 8 janvier, le Bureau d'information Internet de Chine a publié un communiqué sur l'enregistrement des services d'intelligence artificielle générative, soulignant l'importance de promouvoir l'innovation et la réglementation dans ce domaine. Conformément aux dispositions des "Règles provisoires sur la gestion des services d'intelligence artificielle générative", le département de la cybersécurité continuera à promouvoir l'enregistrement des services d'intelligence artificielle générative. Au 31 décembre 2024, 302 services d'intelligence artificielle générative avaient été enregistrés auprès du Cyberspace Administration of China, dont 238 nouveaux services enregistrés en 2024. Cela montre que le domaine de l'intelligence artificielle générative est en pleine expansion...

Shanghai ajoute 9 nouveaux services d'intelligence artificielle générative enregistrés

L'office de cybersécurité de Shanghai a publié un nouveau communiqué concernant l'enregistrement des services d'intelligence artificielle générative, visant à promouvoir l'innovation et l'utilisation réglementée de l'IA générative dans la ville. Conformément aux dispositions du « Règlement provisoire sur la gestion des services d'intelligence artificielle générative », Shanghai a procédé à l'enregistrement ordonné des services d'IA générative et a enregistré les services utilisant les capacités des modèles enregistrés via une API ou d'autres moyens. À ce jour, Shanghai a ajouté 9 nouveaux services d'IA générative enregistrés, portant le nombre total de services enregistrés à 63. Cet enregistrement...

Microsoft met en garde : l'intelligence artificielle générative favorise la cybercriminalité et la manipulation électorale

Microsoft a récemment publié un livre blanc analysant en profondeur l'utilisation malveillante de l'intelligence artificielle (IA) générative, notamment pour la fraude, la création de matériel d'abus sexuel sur les enfants, la manipulation électorale et la diffusion non consentie d'images privées. La société souligne que ces problèmes ne sont pas seulement des défis technologiques, mais aussi de graves menaces pour la société. Note sur l'image : Image générée par IA, fournisseur de services d'autorisation d'images Midjourney. D'après le livre blanc de Microsoft, les criminels utilisent de plus en plus les capacités de l'IA générative pour commettre des actes malveillants. Ces actes incluent l'utilisation d'IA pour générer de fausses...