गूगल विज़न ट्रांसफॉर्मर
ट्रांसफॉर्मर पर आधारित एक छवि पहचान मॉडल
सामान्य उत्पादछविकृत्रिम बुद्धिमत्ताछवि पहचान
गूगल विज़न ट्रांसफॉर्मर एक ट्रांसफॉर्मर एन्कोडर पर आधारित छवि पहचान मॉडल है, जिसे बड़े पैमाने पर छवि डेटा का उपयोग करके पूर्व-प्रशिक्षित किया गया है और इसका उपयोग छवि वर्गीकरण जैसे कार्यों के लिए किया जा सकता है। यह मॉडल ImageNet-21k डेटासेट पर पूर्व-प्रशिक्षित किया गया है और ImageNet डेटासेट पर इसे बेहतर बनाया गया है, जिससे इसमें छवि विशेषताओं को निकालने की बेहतरीन क्षमता है। यह मॉडल छवि डेटा को संसाधित करने के लिए छवि को निश्चित आकार के ब्लॉक्स में विभाजित करता है और इन ब्लॉक्स को रैखिक रूप से एम्बेड करता है। साथ ही, मॉडल इनपुट सीक्वेंस से पहले पोजीशन एन्कोडिंग जोड़ता है ताकि ट्रांसफॉर्मर एन्कोडर में सीक्वेंस डेटा को संसाधित किया जा सके। उपयोगकर्ता पूर्व-प्रशिक्षित एन्कोडर के ऊपर एक रैखिक परत जोड़कर छवि वर्गीकरण जैसे कार्य कर सकते हैं। गूगल विज़न ट्रांसफॉर्मर का लाभ इसकी शक्तिशाली छवि विशेषता अधिगम क्षमता और व्यापक अनुप्रयोगशीलता है। यह मॉडल मुफ्त में उपलब्ध है।
गूगल विज़न ट्रांसफॉर्मर नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
502571820
बाउंस दर
37.10%
प्रति विज़िट औसत पृष्ठ
5.9
औसत विज़िट अवधि
00:06:29