FreGrad est un codeur vocal diffusé léger et rapide sensible à la fréquence, conçu pour générer des sons réalistes. Son architecture inclut une transformée en ondelettes discrète, une convolution dilatée sensible à la fréquence et une série de techniques améliorant la qualité de la génération du modèle. En expérimentation, FreGrad a démontré une amélioration de la vitesse d'entraînement de 3,7 fois, une amélioration de la vitesse d'inférence de 2,2 fois et une réduction de la taille du modèle de 0,6 fois (seulement 1,78 million de paramètres) par rapport aux modèles de référence, sans compromettre la qualité de sortie.