La Universidad del Sur de California, la Universidad de Washington, la Universidad de Bar-Ilan y un equipo de investigación de Google han presentado DreamSync, un nuevo marco de IA que mejora la síntesis de texto a imagen mediante la generación de imágenes candidatas y su evaluación con un modelo de preguntas y respuestas visuales. Este marco no requiere anotaciones manuales, modificaciones en la arquitectura del modelo o aprendizaje por refuerzo. DreamSync, a través de un marco agnóstico del modelo y la retroalimentación de modelos de lenguaje visual, ha logrado mejoras significativas en la alineación y el atractivo visual de los modelos T2I. Simultáneamente, DreamSync ha mejorado con éxito el rendimiento de los modelos SDXL y SD v1.4 T2I.