AudioLCM est un modèle de génération de texte à audio implémenté avec PyTorch. Il génère un audio de haute qualité et de manière efficace grâce à un modèle de cohérence latente. Développé par Huadai Liu et al., il offre une implémentation open-source et des modèles pré-entraînés. Il est capable de transformer des descriptions textuelles en audio réaliste, présentant une valeur applicative importante, notamment dans la synthèse vocale et la production audio.