画像マッチングはコンピュータビジョンの基礎的なタスクであり、近年、深層学習に基づくマッチングモデルが普及しつつあります。深層学習に基づく手法の汎化性の問題を解決するために、厦門大学、Intel、DJIの研究者らは、GIM: Learning Generalizable Image Matcher from Internet Videos を提案しました。GIMは、マッチングモデルがインターネット動画から強力な汎化能力を学習することを可能にし、あらゆるマッチングモデルの訓練に適用できます。また、著者らは初のZero-shot Evaluation Benchmark(ZEB)を提案し、評価結果からGIMがマッチングモデルの汎化性能を大幅に向上させることが示されました。