छवि निर्माण के क्षेत्र में, बहु-स्तरीय छवि निर्माण तकनीक धीरे-धीरे उपयोगकर्ताओं और निर्माण मॉडल के बीच बातचीत के तरीके को बदल रही है, जिससे उपयोगकर्ताओं को विशिष्ट छवि परतों को अलग करना, चुनना और संपादित करना संभव हो जाता है। हाल ही में, माइक्रोसॉफ्ट के शोधकर्ताओं ने एक नई तकनीक पेश की है जिसे "अनाम क्षेत्र ट्रांसफॉर्मर" (ART) कहा जाता है, जो वैश्विक पाठ संकेतों और अनाम क्षेत्र लेआउट के आधार पर सीधे परिवर्तनशील बहु-स्तरीय पारदर्शी छवियों का निर्माण कर सकती है।
ART का डिज़ाइन "स्कीमा सिद्धांत" से प्रेरित है, अनाम क्षेत्र लेआउट को अपनाकर, निर्माण मॉडल को स्वतंत्र रूप से यह तय करने की अनुमति मिलती है कि कौन सी दृश्य जानकारी किस पाठ जानकारी के साथ संरेखित है। यह तरीका पारंपरिक सिमेंटिक लेआउट के विपरीत है। पारंपरिक सिमेंटिक लेआउट को आमतौर पर स्पष्ट पत्राचार की आवश्यकता होती है, जबकि ART का अनाम क्षेत्र लेआउट अधिक लचीलापन प्रदान करता है।
यह ध्यान देने योग्य है कि ART एक स्तर-दर-स्तर क्षेत्र क्रॉपिंग तंत्र पेश करता है, जो केवल प्रत्येक अनाम क्षेत्र से संबंधित दृश्य जानकारी का चयन करता है, जिससे ध्यान गणना की लागत में उल्लेखनीय कमी आती है। यह विधि न केवल निर्माण गति को तेज करती है, जिससे यह पूर्ण-ध्यान विधि से 12 गुना अधिक तेज़ हो जाती है, बल्कि परतों के बीच संघर्ष को भी प्रभावी ढंग से कम करती है, जिससे 50 से अधिक विभिन्न स्तरों की छवि पीढ़ी को संभालना संभव हो जाता है।
इसके अलावा, ART एक उच्च-गुणवत्ता वाले बहु-स्तरीय पारदर्शी छवि ऑटोएन्कोडर प्रस्तुत करता है, जो परिवर्तनशील बहु-स्तरीय छवियों की पारदर्शिता को संयुक्त रूप से सीधे एन्कोड और डिकोड करने का समर्थन करता है। यह नवीन डिज़ाइन सटीक नियंत्रण और स्केलेबल परत निर्माण के लिए नई संभावनाएँ प्रदान करता है, जिससे इंटरैक्टिव सामग्री निर्माण का और विकास होता है।
परियोजना:https://art-msra.github.io/
मुख्य बिंदु:
🌟 ART वैश्विक पाठ संकेतों और अनाम क्षेत्र लेआउट के आधार पर सीधे बहु-स्तरीय पारदर्शी छवियों का निर्माण कर सकता है।
⚡️ स्तर-दर-स्तर क्षेत्र क्रॉपिंग तंत्र को अपनाकर, छवि निर्माण दक्षता में उल्लेखनीय रूप से सुधार हुआ है, जो पारंपरिक विधि से 12 गुना अधिक तेज़ है।
💡 एक नया उच्च-गुणवत्ता वाला ऑटोएन्कोडर बहु-स्तरीय पारदर्शी छवियों के सटीक नियंत्रण और निर्माण का समर्थन करता है, जिससे इंटरैक्टिव सामग्री निर्माण को बढ़ावा मिलता है।