FreGrad
Codificador de voz baseado em difusão, leve, rápido e sensível à frequência
Produto ComumMúsicaÁudioCodificador de Voz
O FreGrad é um codificador de voz baseado em difusão, leve e rápido, projetado para gerar áudio realista. Sua estrutura inclui transformada wavelet discreta, convolução dilatada sensível à frequência e uma série de técnicas para melhorar a qualidade da geração do modelo. Em experimentos, o FreGrad apresentou uma velocidade de treinamento 3,7 vezes maior, uma velocidade de inferência 2,2 vezes maior e um tamanho de modelo 0,6 vezes menor (apenas 1,78 milhões de parâmetros) em comparação com modelos de referência, sem sacrificar a qualidade de saída.
FreGrad Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44