FreGradは、リアルなオーディオ生成を目的とした、軽量で高速な周波数感知拡散音声コーデックです。そのフレームワークは、離散ウェーブレット変換、周波数感知拡張畳み込み、およびモデル生成品質を向上させる一連のテクニックを含みます。実験では、FreGradは基準モデルと比較して、トレーニング速度が3.7倍、推論速度が2.2倍向上し、モデルサイズは0.6倍減少(わずか178万パラメータ)しました。出力品質は犠牲になりません。