Intel a publié l'Extension for Transformers, un kit d'outils qui exploite la technologie LLM Runtime pour améliorer considérablement les performances d'inférence des grands modèles linguistiques (LLM) sur les processeurs, avec un gain de performance pouvant atteindre 40 fois supérieur. Ce kit d'outils optimise les noyaux, prend en charge plusieurs options de quantification et résout les problèmes liés aux scénarios de conversation. Il témoigne du leadership d'Intel dans le domaine de l'intelligence artificielle.
Intel lance Extension for Transformers, un kit de développement logiciel améliorant de 40 fois les performances d'inférence des grands modèles de langage

站长之家
Cet article provient d'AIbase Daily
Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.