Neural Magic est une entreprise spécialisée dans l'optimisation et le déploiement de modèles d'IA. Elle propose des solutions d'inférence de pointe pour les entreprises, visant à maximiser les performances et à améliorer l'efficacité matérielle. Ses produits prennent en charge l'exécution des principaux modèles linguistiques de grande taille (LLM) open source sur les infrastructures GPU et CPU, aidant les entreprises à déployer leurs modèles d'IA de manière sécurisée et efficace dans le cloud, les data centers privés ou en périphérie. L'expertise de Neural Magic en optimisation de modèles d'apprentissage automatique est mise en avant, ainsi que ses collaborations avec des organismes de recherche pour développer des techniques innovantes de compression des LLM, telles que GPTQ et SparseGPT. Concernant les prix et le positionnement, Neural Magic propose des essais gratuits et des services payants, visant à aider les entreprises à réduire leurs coûts, à améliorer leur efficacité et à préserver la confidentialité et la sécurité de leurs données.