छवि मिलान कंप्यूटर दृष्टि का एक बुनियादी कार्य है, और हाल के वर्षों में, गहरे शिक्षण पर आधारित मिलान मॉडल धीरे-धीरे लोकप्रिय हो गए हैं। गहरे शिक्षण विधियों की सामान्यीकरण क्षमता की समस्या को हल करने के लिए, श्यामेन विश्वविद्यालय, इंटेल, और डीजेआई के शोधकर्ताओं ने GIM: इंटरनेट वीडियो से सामान्यीकृत छवि मिलानकर्ता सीखना पेश किया है। GIM मिलान मॉडल को इंटरनेट वीडियो से मजबूत सामान्यीकरण क्षमता सीखने की अनुमति देता है, जो सभी मिलान मॉडल को प्रशिक्षित करने के लिए उपयुक्त है। लेखक ने पहला शून्य-शॉट मूल्यांकन बेंचमार्क (ZEB) पेश किया, और मूल्यांकन परिणामों से पता चलता है कि GIM स्पष्ट रूप से मिलान मॉडल की सामान्यीकरण प्रदर्शन को बढ़ा सकता है।