Bildabgleich ist eine grundlegende Aufgabe im Bereich des Computersehens. In den letzten Jahren haben sich Deep-Learning-basierte Matching-Modelle immer größerer Beliebtheit erfreut. Um das Problem der Generalisierbarkeit von Deep-Learning-Methoden zu lösen, haben Forscher der Xiamen University, Intel und DJI GIM: Learning Generalizable Image Matcher from Internet Videos vorgestellt. GIM ermöglicht es Matching-Modellen, aus Internetvideos eine starke Generalisierungsfähigkeit zu lernen und ist für das Training aller Matching-Modelle geeignet. Die Autoren haben den ersten Zero-Shot Evaluation Benchmark (ZEB) vorgestellt. Die Ergebnisse zeigen, dass GIM die Generalisierungsleistung von Matching-Modellen deutlich verbessern kann.
GIM: Ein großes, von der Xiamen-Universität, Intel und DJI entwickeltes Modell zum Lernen von Null-Schuss-Bildabgleich aus Netzwerkvideos
