Pruna ist ein für Entwickler konzipiertes Modelloptimierungs-Framework, das durch eine Reihe von Komprimierungsalgorithmen wie Quantisierung, Pruning und Kompilierung dafür sorgt, dass Machine-Learning-Modelle bei der Inferenz schneller, kleiner und rechenkostengünstiger sind. Das Produkt eignet sich für verschiedene Modelltypen, darunter LLMs und visuelle Transformer, und unterstützt mehrere Plattformen wie Linux, MacOS und Windows. Pruna bietet auch eine Enterprise-Version, Pruna Pro, die weitere erweiterte Optimierungsfunktionen und bevorzugten Support freischaltet und Benutzern hilft, die Effizienz in der Praxis zu steigern.