aMUSEd é uma plataforma de código aberto que fornece diversos modelos de processamento de linguagem natural (PNL), conjuntos de dados e ferramentas. Inclui o aMUSEd, um modelo de imagem mascarado leve (MIM) baseado em MUSE, usado para gerar imagens a partir de texto. Comparado à difusão latente, o MIM requer menos etapas de inferência e é mais interpretável. Além disso, o MIM pode ser ajustado finamente com apenas uma imagem para aprender estilos adicionais. O aMUSEd também fornece checkpoints de dois modelos, capazes de gerar imagens com resoluções de 256x256 e 512x512.