ConsiStory

Generación de texto a imagen con coherencia sin entrenamiento

Producto ComúnImagenGeneración de imágenesCoherencia
ConsiStory es un método que permite generar imágenes con sujetos coherentes en modelos preentrenados de texto a imagen sin necesidad de entrenamiento. No requiere ajuste fino ni personalización, lo que lo hace 20 veces más rápido que los métodos anteriores. Mejoramos el modelo mediante la introducción de un módulo de atención compartido impulsado por el sujeto y una inyección de características basada en correspondencias para fomentar la coherencia del sujeto entre las imágenes. Además, desarrollamos una estrategia que fomenta la diversidad de diseño manteniendo la coherencia del sujeto. ConsiStory se puede ampliar de forma natural a escenarios con múltiples sujetos e incluso permite la personalización sin entrenamiento de objetos comunes.
Abrir sitio web

ConsiStory Alternativas