Recientemente, un equipo de investigación del Instituto Federal Suizo de Tecnología de Lausana (EPFL) ha presentado un nuevo método llamado ViPer (Visual Personalization of Generative Models via Individual Preference Learning), diseñado para personalizar la salida de modelos generativos según las preferencias visuales del usuario.

Esta innovación se presentó en la próxima conferencia ECCV 2024. El equipo espera que cada usuario pueda obtener resultados generados que se ajusten mejor a sus gustos, utilizando el mismo prompt.

image.png

Acceso al producto:https://top.aibase.com/tool/viper

El funcionamiento de ViPer es muy sencillo. El usuario solo necesita proporcionar una vez sus comentarios sobre un conjunto de imágenes. Estos comentarios se utilizarán para extraer sus preferencias visuales. De esta manera, el modelo generativo puede ajustarse de forma personalizada sin necesidad de prompts complejos, utilizando estas propiedades para generar imágenes que se ajusten a los gustos del usuario.

En pocas palabras, esto es similar a la función de preferencias personalizadas lanzada anteriormente por Midjourney (--personalize). Para utilizar el modelo personalizado de Midjourney, los usuarios necesitan haber dado "me gusta" o puntuado al menos 200 imágenes en emparejamientos de clasificación. Estas puntuaciones y "me gusta" ayudan a Midjourney a aprender las preferencias del usuario, permitiendo que el modelo personalizado refleje con mayor precisión sus gustos.

image.png

El modelo de este proyecto ya se ha publicado en la plataforma Huggingface, y los usuarios pueden descargarlo y utilizarlo fácilmente. El modelo VPE de ViPer está finamente ajustado para extraer las preferencias individuales a partir de una serie de imágenes y comentarios proporcionados por el usuario.

Además, el proyecto proporciona un modelo de métrica proxy que puede predecir la puntuación de preferencia de una imagen de consulta en función de las imágenes que al usuario le gustan y las que no. Esto significa que el usuario puede comprender mejor sus preferencias potenciales para nuevas imágenes.

Asimismo, ViPer ofrece un mecanismo de puntuación proxy. Los usuarios pueden proporcionar imágenes que les gustan y otras que no, para calcular la puntuación de una imagen de consulta. Esta puntuación oscila entre 0 y 1; cuanto mayor sea la puntuación, mayor será la preferencia del usuario por la imagen. El equipo recomienda que cada usuario proporcione aproximadamente 8 imágenes que le gusten y 8 que no le gusten para asegurar la precisión de los resultados.

image.png

Puntos clave:

🌟 ViPer extrae las preferencias visuales individuales del usuario a través de un único comentario, personalizando así la salida del modelo generativo.

🖼️ El modelo de este proyecto ya se ha publicado en Huggingface, y los usuarios pueden descargarlo y utilizarlo fácilmente.

📊 ViPer ofrece un mecanismo de puntuación proxy que ayuda a los usuarios a predecir su grado de preferencia por nuevas imágenes.