AudioLCM é um modelo de geração de áudio a partir de texto implementado em PyTorch, que gera áudio de alta qualidade e eficiente por meio de um modelo de consistência latente. Desenvolvido por Huadai Liu e outros, oferece implementação de código aberto e modelos pré-treinados. Ele consegue converter descrições de texto em áudio quase real, possuindo um importante valor de aplicação, especialmente nas áreas de síntese de voz e produção de áudio.