La Universidad del Sur de California, la Universidad de Washington, la Universidad de Bar-Ilan y un equipo de investigación de Google han presentado DreamSync, un nuevo marco de IA que mejora la síntesis de texto a imagen mediante la generación de imágenes candidatas y su evaluación con un modelo de preguntas y respuestas visuales. Este marco no requiere anotaciones manuales, modificaciones en la arquitectura del modelo o aprendizaje por refuerzo. DreamSync, a través de un marco agnóstico del modelo y la retroalimentación de modelos de lenguaje visual, ha logrado mejoras significativas en la alineación y el atractivo visual de los modelos T2I. Simultáneamente, DreamSync ha mejorado con éxito el rendimiento de los modelos SDXL y SD v1.4 T2I.
Nuevo marco de IA DreamSync: Mejora la síntesis de texto a imagen mediante la retroalimentación de modelos de comprensión de imágenes

站长之家
Este artículo proviene de AIbase Daily
¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.