La correspondance d'images est une tâche fondamentale de la vision par ordinateur. Récemment, les modèles de correspondance basés sur l'apprentissage profond sont devenus de plus en plus populaires. Pour résoudre le problème de la généralisation des méthodes basées sur l'apprentissage profond, des chercheurs de l'Université de Xiamen, d'Intel et de DJI ont proposé GIM : Learning Generalizable Image Matcher from Internet Videos. GIM permet aux modèles de correspondance d'apprendre une forte capacité de généralisation à partir de vidéos Internet, applicable à l'entraînement de tous les modèles de correspondance. Les auteurs ont proposé le premier Zero-shot Evaluation Benchmark (ZEB). Les résultats de l'évaluation montrent que GIM peut améliorer significativement les performances de généralisation des modèles de correspondance.