Aphrodite ist die offizielle Backend-Engine von PygmalionAI. Sie dient der Bereitstellung von Inferenz-Endpunkten für die PygmalionAI-Website und ermöglicht die effiziente Bedienung des Pygmalion-Modells für eine große Anzahl von Nutzern mit höchster Geschwindigkeit. Aphrodite nutzt die paginierte Aufmerksamkeitstechnik von vLLM und implementiert Funktionen wie kontinuierliche Batchverarbeitung, effizientes Key-Value-Management und optimierte CUDA-Kernels. Sie unterstützt verschiedene Quantisierungsmethoden zur Steigerung der Inferenzleistung.