O modelo aMUSEd, lançado pela Hugging Face, pode gerar imagens em segundos. Trata-se de um modelo leve de texto para imagem, que utiliza a arquitetura Masked Image Model (MIM), reduzindo significativamente as etapas de inferência, o que aumenta a velocidade de geração e a explicabilidade. O modelo aMUSEd pode ser experimentado na demonstração da Hugging Face. Atualmente, está disponível como versão de pré-visualização para pesquisa, sob a licença OpenRAIL, incentivando a comunidade a explorar ainda mais estruturas não-difusivas para geração de imagens.
Hugging Face lança o modelo aMUSEd, gerando imagens em segundos
