MagicQuill es un sistema integrado de edición de imágenes diseñado para ayudar a los usuarios a realizar sus ideas creativas rápidamente. El sistema parte de una interfaz sencilla pero potente que permite a los usuarios expresar sus ideas con unos pocos trazos, como insertar elementos, borrar objetos o cambiar colores. Estas interacciones son monitoreadas en tiempo real por un modelo de lenguaje grande multimodal (MLLM) para predecir la intención del usuario sin necesidad de indicaciones. Finalmente, aplicamos un potente conocimiento previo de difusión, mediante un módulo de plugins de doble rama cuidadosamente entrenado, para controlar con precisión las solicitudes de edición.