हाल ही में, एक नई छवि सुपर रेजोल्यूशन मॉडल जिसका नाम AuraSR है, ने आर्टिफिशियल इंटेलिजेंस समुदाय में व्यापक ध्यान आकर्षित किया है। इस मॉडल को Fal AI कंपनी द्वारा विकसित किया गया है, जो Adobe द्वारा हाल ही में प्रकाशित GigaGAN पेपर पर आधारित है, और यह जनरेटिव एडवर्सेरियल नेटवर्क (GAN) तकनीक का उपयोग करता है, जो बहुत कम समय में छवि के रिज़ॉल्यूशन को काफी बढ़ा सकता है।

AuraSR मॉडल के निम्नलिखित प्रमुख विशेषताएँ हैं:

  1. पैरामीटर की संख्या 600 मिलियन है, जो इसे शक्तिशाली बनाती है।
  2. यह GAN तकनीक का उपयोग करता है, पारंपरिक प्रसार मॉडलों की तुलना में तेजी से प्रोसेसिंग करता है।
  3. यह 4 गुना सुपर रेजोल्यूशन प्रोसेसिंग करने में सक्षम है, 512 पिक्सेल छवि को 1024 पिक्सेल में बढ़ा सकता है।
  4. प्रोसेसिंग की गति आश्चर्यजनक है, केवल 1/4 सेकंड में उपरोक्त रिज़ॉल्यूशन को बढ़ा सकता है।

वर्तमान में, AuraSR मॉडल और इसका प्रदर्शन Hugging Face प्लेटफ़ॉर्म पर लाइव है। शोधकर्ता Gokay Aydogan द्वारा निर्मित ऑनलाइन डेमो उपयोगकर्ताओं को इस प्र breakthrough तकनीक का अनुभव करने की अनुमति देता है। इस मॉडल का PyTorch कार्यान्वयन अनौपचारिक lucidrains/gigagan-pytorch कोडबेस पर आधारित है।

AuraSR की उपस्थिति छवि प्रोसेसिंग क्षेत्र में नई संभावनाएं लाती है, विशेष रूप से जनरेटिव AI छवियों के सुपर रेजोल्यूशन प्रोसेसिंग में इसके व्यापक अनुप्रयोग की संभावनाएँ हैं। इसकी तेज प्रोसेसिंग क्षमता और उच्च गुणवत्ता का आउटपुट इसे रीयल-टाइम छवि प्रोसेसिंग, वीडियो गेम ग्राफिक्स सुधार आदि क्षेत्रों में संभावित अनुप्रयोगों के लिए उपयुक्त बनाता है। जैसे-जैसे तकनीक में सुधार होता है, हमें उम्मीद है कि भविष्य में इस तकनीक पर आधारित और अधिक नवाचार अनुप्रयोग सामने आएंगे।

मॉडल का आधिकारिक अनुभव पते: https://fal.ai/models/fal-ai/aura-sr/playground

Hugging Face मॉडल अनुभव पते: https://huggingface.co/spaces/gokaygokay/AuraSR