AudioLCM ist ein auf PyTorch basierendes Text-zu-Audio-Generierungsmodell, das hochwertige und effiziente Audiodaten mithilfe eines latenten Konsistenzmodells erzeugt. Das von Huadai Liu et al. entwickelte Modell bietet eine Open-Source-Implementierung und vorab trainierte Modelle. Es kann Textbeschreibungen in nahezu realistische Audiodaten umwandeln und besitzt einen hohen Anwendungswert, insbesondere in den Bereichen Sprachsynthese und Audioproduktion.