इस व्यक्तिगतता के युग में, एआई आपको कैसे बेहतर समझ सकता है? कल्पना कीजिए, जब आप चैट सॉफ़्टवेयर में "मैंने पास कर लिया, बहुत खुश हूँ!" टाइप करते हैं, एक ऐसा एआई जो आपकी भावनाओं को समझता है, न केवल आपकी उत्साह भरी भावना को पहचानता है, बल्कि यह भी याद रखता है कि आपको मुस्कुराते हुए बिल्ली के इमोजी पसंद हैं, इसलिए यह आपके लिए एक अनूठा मुस्कुराते हुए बिल्ली के इमोजी पैक तैयार करता है।
कृत्रिम बुद्धिमत्ता के व्यक्तिगतता उत्पन्न करने के क्षेत्र में, हुआवेई और तिनहुआ विश्वविद्यालय ने मिलकर एक नई तकनीक विकसित की है जिसे PMG (Personalized Multimodal Generation) कहा जाता है। यह तकनीक उपयोगकर्ता के पिछले व्यवहार और प्राथमिकताओं के आधार पर, उपयोगकर्ता की व्यक्तिगत आवश्यकताओं के अनुसार विभिन्न प्रकार की मल्टीमॉडल सामग्री जैसे इमोजी पैक, टी-शर्ट डिज़ाइन, फिल्म पोस्टर आदि उत्पन्न कर सकती है।
PMG का कार्यप्रणाली क्या है? यह उपयोगकर्ता के फिल्म देखने और संवाद इतिहास का विश्लेषण करके, बड़े भाषा मॉडल की तर्क शक्ति के साथ मिलाकर, उपयोगकर्ता की प्राथमिकताओं को निकालता है। इस प्रक्रिया में स्पष्ट कीवर्ड उत्पन्न करना और निहित उपयोगकर्ता प्राथमिकता वेक्टर उत्पन्न करना शामिल है, जो मिलकर मल्टीमॉडल सामग्री के निर्माण के लिए समृद्ध जानकारी प्रदान करता है।
वास्तविक अनुप्रयोग में, PMG तकनीक निम्नलिखित कार्यक्षमताओं को सक्षम बनाती है:
कीवर्ड उत्पन्न करना: उपयोगकर्ता की प्राथमिकताओं को कीवर्ड के रूप में निकालने के लिए बड़े मॉडल को मार्गदर्शित करने वाले संकेत शब्दों का निर्माण करना।
निहित वेक्टर उत्पन्न करना: उपयोगकर्ता की प्राथमिकता कीवर्ड और लक्ष्य कीवर्ड को मिलाकर, P-Tuning V2 द्वारा माइक्रो-ट्यून किए गए पूर्वाग्रह सुधार बड़े मॉडल का उपयोग करके, मल्टीमॉडल उत्पन्न करने की क्षमता को सीखना।
उपयोगकर्ता प्राथमिकता और लक्ष्य का संतुलन: व्यक्तिगतता स्तर और सटीकता की गणना करके, उत्पन्न सामग्री के प्रभाव को मापना और अनुकूलित करना।
अनुसंधान टीम ने ई-कॉमर्स परिधान छवि उत्पन्न करने, फिल्म पोस्टर दृश्य और इमोजी उत्पन्न करने के तीन अनुप्रयोग परिदृश्यों के माध्यम से PMG तकनीक की प्रभावशीलता का परीक्षण किया। प्रयोगात्मक परिणाम बताते हैं कि PMG उपयोगकर्ता की प्राथमिकताओं को दर्शाने वाली व्यक्तिगत सामग्री उत्पन्न कर सकता है, और यह छवि समानता मापदंड LPIPS और SSIM पर उत्कृष्ट प्रदर्शन करता है।
यह तकनीक न केवल सिद्धांत में नवोन्मेषी है, बल्कि वास्तविक अनुप्रयोग में भी विशाल क्षमता और व्यावसायिक मूल्य प्रस्तुत करती है। व्यक्तिगत आवश्यकताओं की बढ़ती मांग के साथ, PMG तकनीक भविष्य में विस्फोटक वृद्धि की उम्मीद कर सकती है, जिससे उपयोगकर्ताओं को और भी समृद्ध, व्यक्तिगत अनुभव प्राप्त होगा।
प्रोजेक्ट पता: https://github.com/mindspore-lab/models/tree/master/research/huawei-noah/PMG