El modelo aMUSEd de Hugging Face

El modelo aMUSEd, desarrollado por Hugging Face, puede generar imágenes en cuestión de segundos. Se trata de un modelo ligero de texto a imagen que utiliza la arquitectura Masked Image Model (MIM), lo que reduce significativamente los pasos de inferencia, aumentando así la velocidad de generación y su explicabilidad.

Puedes probar el modelo aMUSEd en la demostración de Hugging Face. Actualmente se ofrece como versión preliminar de investigación bajo la licencia OpenRAIL, lo que fomenta la exploración comunitaria de marcos no difusivos para la generación de imágenes.