नवीनतम अनुसंधान से पता चला है कि कॉन्वोल्यूशन न्यूरल नेटवर्क (ConvNets) बड़े पैमाने के डेटा सेट पर विज़न ट्रांसफार्मर्स (Vision Transformers) के साथ प्रतिस्पर्धा कर सकते हैं, जो पहले के दृष्टिकोण को चुनौती देता है। अनुसंधान टीम ने NFNet मॉडल का उपयोग करके विशाल JFT-4B डेटा सेट पर प्रशिक्षण दिया, और पाया कि गणना संसाधन और उपलब्ध डेटा की मात्रा मॉडल के प्रदर्शन के मुख्य प्रभाव कारक हैं। NFNet आर्किटेक्चर बड़े पैमाने के डेटा सेट पर प्रतिस्पर्धात्मकता प्रदर्शित करता है। यह अनुसंधान कंप्यूटर दृष्टि अनुसंधान के लिए नई अंतर्दृष्टि प्रदान करता है।