हाल ही में, स्विट्जरलैंड के लोज़ान पॉलीटेक्निक संस्थान की शोध टीम ने एक नई विधि पेश की है, जिसका नाम ViPer (Visual Personalization of Generative Models via Individual Preference Learning) है, जिसका उद्देश्य उपयोगकर्ताओं की दृश्य प्राथमिकताओं के अनुसार जनरेटिव मॉडल के आउटपुट को व्यक्तिगत बनाना है।

यह नवाचार आगामी 2024 ECCV सम्मेलन में प्रदर्शित किया जाएगा, और टीम चाहती है कि हर उपयोगकर्ता समान संकेत पर, अपनी पसंद के अनुसार जनरेटेड परिणाम प्राप्त कर सके।

image.png

उत्पाद का लिंक:https://top.aibase.com/tool/viper

ViPer का काम करना बहुत सरल है। उपयोगकर्ता को केवल एक बार एक समूह की छवियों पर अपनी टिप्पणियाँ प्रदान करनी होती हैं, जो उनकी दृश्य प्राथमिकताओं को निकालने के लिए उपयोग की जाती हैं। इस तरह, जनरेटिव मॉडल बिना जटिल संकेतों के व्यक्तिगत समायोजन कर सकता है, इन गुणों का उपयोग करके उपयोगकर्ता की पसंद के अनुसार छवियाँ उत्पन्न कर सकता है।

सरल शब्दों में, यह Midjourney द्वारा पेश की गई व्यक्तिगत प्राथमिकता सुविधा (--personalize) के समान है, जिसमें उपयोगकर्ताओं को पिछले जोड़ी रैंकिंग में कम से कम 200 बार छवियों को पसंद या रेटिंग देना आवश्यक होता है। ये रेटिंग और पसंद के व्यवहार Midjourney को उपयोगकर्ता की प्राथमिकताओं को सीखने में मदद करते हैं, जिससे व्यक्तिगत मॉडल उपयोगकर्ता की पसंद को अधिक सटीकता से दर्शा सके।

image.png

इस परियोजना का मॉडल Huggingface प्लेटफार्म पर प्रकाशित किया गया है, जिससे उपयोगकर्ता इसे आसानी से डाउनलोड और उपयोग कर सकते हैं। ViPer में VPE मॉडल को उपयोगकर्ता द्वारा प्रदान की गई छवियों और टिप्पणियों की एक श्रृंखला से व्यक्तिगत प्राथमिकताओं को निकालने के लिए सावधानीपूर्वक समायोजित किया गया है।

साथ ही, परियोजना एक प्रॉक्सी मेट्रिक मॉडल भी प्रदान करती है, जो उपयोगकर्ता द्वारा पसंद और नापसंद की गई छवियों के आधार पर किसी प्रश्न छवि की पसंद के स्कोर की भविष्यवाणी कर सकती है। इसका मतलब है कि उपयोगकर्ता नई छवियों के प्रति अपनी संभावित प्राथमिकताओं को बेहतर ढंग से समझ सकते हैं।

इसके अलावा, ViPer एक प्रॉक्सी स्कोरिंग तंत्र भी प्रदान करता है, जिससे उपयोगकर्ता पसंदीदा और नापसंद छवियों को प्रदान करके प्रश्न छवि का स्कोर निकाल सकते हैं। यह स्कोर 0 से 1 के बीच होता है, और उच्च स्कोर यह दर्शाता है कि उपयोगकर्ता उस छवि को अधिक पसंद करता है। टीम सुझाव देती है कि प्रत्येक उपयोगकर्ता लगभग 8 पसंदीदा और 8 नापसंद छवियों को प्रदान करे, ताकि परिणाम की सटीकता सुनिश्चित हो सके।

image.png

मुख्य बातें:

🌟 ViPer उपयोगकर्ता की एक बार की टिप्पणियों से व्यक्तिगत दृश्य प्राथमिकताओं को निकालता है, जिससे जनरेटिव मॉडल के आउटपुट को व्यक्तिगत बनाया जा सके।  

🖼️ इस परियोजना का मॉडल Huggingface पर प्रकाशित किया गया है, जिससे उपयोगकर्ता आसानी से डाउनलोड और उपयोग कर सकते हैं।  

📊 ViPer प्रॉक्सी स्कोरिंग तंत्र प्रदान करता है, जो उपयोगकर्ताओं को नई छवियों के प्रति उनकी पसंद की भविष्यवाणी करने में मदद करता है।