हाल ही में, शोध टीम ने एक नई इमेज सुपर रिज़ॉल्यूशन (SR) तकनीक जारी की है, जो डिफ्यूजन इनवर्जन (Diffusion Inversion) पर आधारित है। इसका उद्देश्य बड़े पूर्व-प्रशिक्षित डिफ्यूजन मॉडल में इमेज प्रायर जानकारी का पूरा उपयोग करके इमेज की रिज़ॉल्यूशन और स्पष्टता को बढ़ाना है। यह शोध विभिन्न शैक्षणिक संस्थानों के तीन विद्वानों द्वारा संयुक्त रूप से पूरा किया गया है, जिनका लक्ष्य इमेज सुपर रिज़ॉल्यूशन क्षेत्र में नए breakthroughs लाना है।

image.png

इस तकनीक में, शोधकर्ताओं ने "पार्शियल नॉइज़ प्रीडिक्शन" (Partial Noise Prediction) नामक एक रणनीति का डिज़ाइन किया है, जो डिफ्यूजन मॉडल की मध्य स्थिति को प्रारंभिक सैंपलिंग बिंदु के रूप में बनाती है। यह मुख्य विधि एक गहरे नॉइज़ प्रीडिक्टर पर निर्भर करती है, जो अग्रणी डिफ्यूजन प्रक्रिया के लिए सर्वोत्तम नॉइज़ चित्र प्रदान कर सकता है। प्रशिक्षण के बाद, यह नॉइज़ प्रीडिक्टर सैंपलिंग प्रक्रिया को आंशिक रूप से प्रारंभ करने में सक्षम होता है, और डिफ्यूजन ट्रैक के साथ उच्च रिज़ॉल्यूशन इमेज उत्पन्न करता है।

वर्तमान सुपर रिज़ॉल्यूशन विधियों की तुलना में, यह तकनीक एक अधिक लचीला और कुशल सैंपलिंग तंत्र प्रदान करती है, जो एक से लेकर पांच तक किसी भी संख्या के सैंपलिंग चरणों का समर्थन करती है। यह ध्यान देने योग्य है कि केवल एक सैंपलिंग चरण का उपयोग करने पर भी, यह नई विधि वर्तमान अत्याधुनिक तकनीकों के प्रदर्शन से बेहतर या तुलनीय है।

image.png

शोध टीम ने आवश्यक सॉफ़्टवेयर और हार्डवेयर वातावरण, मॉडल डाउनलोड लिंक और सीमित GPU मेमोरी परिस्थितियों में कार्यक्रम कैसे चलाना है, इसकी विस्तृत उपयोग निर्देश और प्रशिक्षण मार्गदर्शिका भी प्रदान की है। ये जानकारी शोधकर्ताओं और डेवलपर्स को इस तकनीक का उपयोग करके इमेज सुपर रिज़ॉल्यूशन से संबंधित कार्य करने में मदद करेगी।

इसके अलावा, शोध टीम ने एक ऑनलाइन डेमो प्लेटफ़ॉर्म स्थापित किया है, जिससे उपयोगकर्ताओं को इस नवाचार तकनीक का सहज अनुभव प्राप्त करने में आसानी होती है, और उन्होंने शोध परिणामों को सत्यापित करने के लिए सिंथेटिक डेटा सेट और वास्तविक डेटा सेट के लिंक भी प्रदान किए हैं। शोधकर्ता आशा करते हैं कि इस तकनीक के माध्यम से, वे इमेज सुपर रिज़ॉल्यूशन के वास्तविक अनुप्रयोगों के लिए अधिक कुशल और स्पष्ट समाधान प्रदान कर सकें।

image.png

प्रोजेक्ट लिंक: https://github.com/zsyOAOA/InvSR?tab=readme-ov-file

डेमो: https://huggingface.co/spaces/OAOA/InvSR

मुख्य बिंदु:

🌟 यह नई तकनीक डिफ्यूजन इनवर्जन पर आधारित है, जो इमेज रिज़ॉल्यूशन को प्रभावी ढंग से बढ़ा सकती है।  

🔍 "पार्शियल नॉइज़ प्रीडिक्शन" रणनीति अपनाकर, यह विभिन्न सैंपलिंग चरणों का लचीला समर्थन करती है।  

💻 उपयोगकर्ताओं के संचालन और अनुभव के लिए विस्तृत उपयोग मार्गदर्शिका और ऑनलाइन डेमो प्रदान किया गया है।