Aphrodite-Engine
Die hochskalierbare Inferenz-Engine von PygmalionAI
Normales ProduktProgrammierungHochskalierbare InferenzSprachmodell
Aphrodite ist die offizielle Backend-Engine von PygmalionAI. Sie dient der Bereitstellung von Inferenz-Endpunkten für die PygmalionAI-Website und ermöglicht die effiziente Bedienung des Pygmalion-Modells für eine große Anzahl von Nutzern mit höchster Geschwindigkeit. Aphrodite nutzt die paginierte Aufmerksamkeitstechnik von vLLM und implementiert Funktionen wie kontinuierliche Batchverarbeitung, effizientes Key-Value-Management und optimierte CUDA-Kernels. Sie unterstützt verschiedene Quantisierungsmethoden zur Steigerung der Inferenzleistung.
Aphrodite-Engine Neueste Verkehrssituation
Monatliche Gesamtbesuche
474564576
Absprungrate
36.20%
Durchschnittliche Seiten pro Besuch
6.1
Durchschnittliche Besuchsdauer
00:06:34