AudioLCM es un modelo de generación de audio a partir de texto implementado en PyTorch, que genera audio de alta calidad y eficiencia mediante un modelo de consistencia latente. Desarrollado por Huadai Liu y colaboradores, ofrece una implementación de código abierto y modelos preentrenados. Es capaz de convertir descripciones de texto en audio casi real, con un importante valor aplicado, especialmente en los campos de la síntesis de voz y la producción de audio.