Tencent EMMA

Modelo de generación de imágenes a partir de texto multimodal

Nuevo Producto PremiumImagenGeneración de imágenesMultimodal
EMMA es un nuevo modelo de generación de imágenes basado en el modelo de difusión de texto a imagen de vanguardia ELLA. Capaz de aceptar indicaciones multimodales, integra eficazmente la información textual y modal complementaria a través de un innovador diseño de conector de características multimodales. El modelo revela una interesante característica de los modelos de difusión T2I preentrenados: la capacidad de aceptar, en secreto, indicaciones multimodales, al congelar todos los parámetros del modelo de difusión T2I original y ajustar solo algunas capas adicionales. EMMA se adapta fácilmente a diferentes marcos existentes, siendo una herramienta flexible y eficiente para generar imágenes e incluso videos personalizados y contextualizados.
Abrir sitio web

Tencent EMMA Alternativas