Esta semana, el equipo de Alibaba Cloud Tongyi Wanxiang lanzó el nuevo modelo de edición de imágenes ACE, diseñado para ofrecer a los usuarios un servicio de generación y edición de imágenes más conveniente e inteligente. Con simples instrucciones en lenguaje natural, los usuarios pueden generar o modificar imágenes, simplificando enormemente la complejidad de la edición de imágenes. Esta herramienta admite una amplia gama de escenarios de aplicación, incluyendo retratos estilizados, creación de storyboards y diseño de interiores.
El modelo ACE no solo admite la generación de imágenes a partir de texto (texto a imagen), sino que también cuenta con potentes funciones de edición de imágenes. Los usuarios pueden realizar ediciones visuales controlables, modificaciones de elementos, redibujado de áreas y edición por capas mediante una interfaz conversacional.
Por ejemplo, los usuarios solo necesitan introducir instrucciones como "modificar el fondo de una foto de carnet" o "eliminar la marca de agua con un clic" para lograr fácilmente funciones similares a las de Photoshop. Cabe destacar que la función de estilización local de ACE ya está disponible en la aplicación Tongyi, mejorando aún más la experiencia del usuario.
Según la información oficial, la innovación central del modelo ACE radica en su exclusivo módulo Long-context Condition Unit (LCU). El LCU admite la entrada de condiciones multimodales, satisface las necesidades de diversas tareas de edición general y ha establecido una cadena de construcción de datos de edición completa y una cadena de generación de conjuntos de instrucciones, garantizando así la precisión y la alta calidad de los resultados de la edición de imágenes.
El lanzamiento de ACE no solo amplía la aplicación de la IA en el campo de la edición de imágenes, sino que también proporciona soporte de código abierto a desarrolladores de todo el mundo, lo que representa un nuevo avance de Alibaba Cloud en el campo de la tecnología de procesamiento de imágenes inteligentes. Esta nueva herramienta mejorará enormemente la eficiencia y la comodidad del procesamiento de imágenes, ofreciendo a los usuarios una experiencia de edición más creativa y personalizada.
Dirección del código abierto:
https://github.com/ali-vilab/ACE
Dirección de prueba:
https://huggingface.co/spaces/scepter-studio/ACE-Chat
Comunidad MoDa:
https://www.modelscope.cn/models/iic/ACE-0.6B-1024px