La correspondencia de imágenes es una tarea fundamental en la visión por computadora. Recientemente, los modelos de correspondencia basados en el aprendizaje profundo se han vuelto cada vez más populares. Para abordar el problema de la generalización de los métodos basados en el aprendizaje profundo, investigadores de la Universidad de Xiamen, Intel y DJI presentaron GIM: Aprendizaje de un Correspondiente de Imágenes Generalizable a partir de Videos de Internet. GIM permite que los modelos de correspondencia aprendan una fuerte capacidad de generalización a partir de videos de internet, siendo aplicable al entrenamiento de todos los modelos de correspondencia. Los autores propusieron el primer Benchmark de Evaluación Zero-shot (ZEB), y los resultados de la evaluación muestran que GIM puede mejorar significativamente el rendimiento de generalización de los modelos de correspondencia.
GIM: Un gran modelo de emparejamiento de imágenes de muestra cero que aprende de vídeos online, desarrollado conjuntamente por la Universidad de Xiamen, Intel y DJI
