ब्रिटेन के सरे विश्वविद्यालय और स्टैनफोर्ड विश्वविद्यालय की शोध टीम ने एक नई विधि विकसित की है, जो कृत्रिम बुद्धिमत्ता (AI) को मानव रेखाचित्रों को समझाना सिखाती है, भले ही वे गैर-कलाकारों द्वारा बनाए गए हों। यह मॉडल दृश्य रेखाचित्रों की पहचान में मानव स्तर के प्रदर्शन के करीब है।

image.png

सरे विश्वविद्यालय के दृश्य, भाषण और सिग्नल प्रोसेसिंग केंद्र (CVSSP) और सरे पीपुल्स सेंटर आर्टिफिशियल इंटेलिजेंस रिसर्च इंस्टीट्यूट (PAI) की व्याख्याता डॉ. यूलिया ग्र्यादित्स्काया ने कहा: "रेखाचित्र एक शक्तिशाली दृश्य संचार भाषा है। यह कभी-कभी मौखिक भाषा से भी अधिक व्यक्तिपरक और लचीला होता है। रेखाचित्रों को समझने के उपकरण विकसित करना मानव-यांत्रिकी इंटरफेस और अधिक प्रभावी डिजाइन कार्यप्रवाह की दिशा में एक कदम है। उदाहरण के लिए, रेखाचित्रों के माध्यम से छवियों को खोजने या बनाने की क्षमता।" उम्र और पृष्ठभूमि की परवाह किए बिना, लोग नए विचारों की खोज और संवाद के लिए चित्रण का उपयोग करते हैं। हालांकि, कृत्रिम बुद्धिमत्ता प्रणालियों के लिए रेखाचित्रों को समझना हमेशा एक चुनौती रहा है। AI को छवियों को समझना सीखना होता है। आमतौर पर, इसमें प्रत्येक पिक्सेल के लेबल को इकट्ठा करने की एक समय-consuming प्रक्रिया शामिल होती है। फिर AI इन लेबलों से सीखता है।

हालांकि, शोध टीम ने रेखाचित्रों और पाठ विवरणों के संयोजन के माध्यम से AI को सिखाया। इसे पिक्सेल को समूहित करना और उन्हें विवरण में श्रेणियों से मेल करना सिखाया गया। परिणामस्वरूप, AI ने पहले से कहीं अधिक समृद्ध और मानव के करीब की समझ प्रदर्शित की। यह 85% सटीकता के साथ पतंग, पेड़, जिराफ और अन्य वस्तुओं की सही पहचान और लेबलिंग करने में सक्षम है, जो लेबल किए गए पिक्सेल पर निर्भर अन्य मॉडलों से बेहतर है। जटिल दृश्यों में वस्तुओं की पहचान के अलावा, यह यह भी निर्धारित कर सकता है कि प्रत्येक स्ट्रोक किस वस्तु को चित्रित करने के लिए है। यह नई विधि न केवल गैर-कलाकारों द्वारा बनाए गए अनौपचारिक रेखाचित्रों पर लागू होती है, बल्कि उन रेखाचित्रों पर भी जो बिना स्पष्ट प्रशिक्षण के बनाए गए हैं।

स्टैनफोर्ड विश्वविद्यालय के मनोविज्ञान के सहायक प्रोफेसर जूडिथ फैन ने कहा: "चित्रित करना और लिखना मानव गतिविधियों में से एक सबसे विशिष्ट है, जिसका लंबे समय से लोगों की अवलोकनों और विचारों को कैद करने के लिए उपयोग किया जाता रहा है। यह कार्य AI प्रणालियों को उन विचारों की प्रकृति को समझने में उत्साहजनक प्रगति प्रदान करता है जो लोग संप्रेषित करने का प्रयास कर रहे हैं, चाहे वे चित्रों या शब्दों का उपयोग कर रहे हों।" यह शोध सरे विश्वविद्यालय के पीपुल्स सेंटर आर्टिफिशियल इंटेलिजेंस रिसर्च इंस्टीट्यूट का एक हिस्सा है, विशेष रूप से इसके SketchX कार्यक्रम का। SketchX AI का उपयोग करके यह समझने की कोशिश करता है कि हम जिस तरह से चित्रित करते हैं, वह हमारी दुनिया को देखने के तरीके को कैसे दर्शाता है।

पीपुल्स सेंटर आर्टिफिशियल इंटेलिजेंस रिसर्च इंस्टीट्यूट के सह-निदेशक और SketchX के प्रमुख प्रोफेसर सोंग यिजे ने कहा: "यह शोध यह दिखाने का एक उदाहरण है कि AI कैसे रेखाचित्रों जैसे मौलिक मानव गतिविधियों को बढ़ा सकता है।粗糙 रेखाचित्रों को मानव के करीब सटीकता से समझने के माध्यम से, इस तकनीक में लोगों की स्वाभाविक रचनात्मकता को बढ़ाने की बड़ी क्षमता है, चाहे उनकी कला की प्रतिभा कोई भी हो।"  

पेपर का पता: https://arxiv.org/abs/2312.12463