इंटरनेट युग में, जानकारी की अधिकता है, ज्ञान ग्राफ़ (KGs) अब हमारी दुनिया को समझने और व्यवस्थित करने के लिए एक महत्वपूर्ण उपकरण बन गए हैं। लेकिन सवाल यह है, जब विभिन्न ज्ञान ग्राफ़ मिलते हैं, तो वे एक-दूसरे की संस्थाओं को कैसे पहचानते और संरेखित करते हैं? यह एक बड़े पार्टी में इस तरह है, कि कैसे विभिन्न पृष्ठभूमियों से आए मेहमान एक-दूसरे को जानें और दोस्त बनें।

हाल ही में, "AutoAlign: Fully Automatic and Effective Knowledge Graph Alignment enabled by Large Language Models" नामक एक पेपर ने हमें एक अद्भुत समाधान - AutoAlign प्रदान किया। यह केवल एक तकनीकी सफलता नहीं है, बल्कि AI क्षेत्र का एक "सोशल पार्टी" है।

image.png

कल्पना कीजिए, आप एक पार्टी आयोजक हैं, आपको सुनिश्चित करना है कि हर मेहमान अपने दोस्तों को खोज सके। ज्ञान ग्राफ़ की दुनिया में, ये "मेहमान" संस्थाएँ हैं, और AutoAlign उस जादुई पार्टी आयोजक की तरह है।

AutoAlign एक नया ज्ञान ग्राफ़ संरेखण विधि है, जो पूरी तरह से स्वचालित और कुशल है। इसे किसी भी हाथ से बनाए गए बीज संरेखण (seed alignments) की आवश्यकता नहीं है, इसका मतलब है कि आपको पहले से यह नहीं बताना है कि कौन सी संस्थाएँ दोस्त हैं। यह एक पार्टी में इस तरह है, कि आपको पहले से हर किसी का परिचय देने की आवश्यकता नहीं है, AutoAlign स्वचालित रूप से उन्हें पहचान और परिचय करवा सकता है।

AutoAlign का जादुई रहस्य इस बात में है कि यह बड़े भाषा मॉडल (जैसे ChatGPT और Claude) का उपयोग करके एक प्रीडिकेट निकटता ग्राफ़ (predicate-proximity-graph) बनाता है। यह ग्राफ़ AutoAlign को विभिन्न ज्ञान ग्राफ़ में समान प्रीडिकेट को स्वचालित रूप से पहचानने में मदद करता है। यह ठीक उसी तरह है जैसे पार्टी आयोजक मेहमानों के व्यवहार और बातचीत का अवलोकन करके उनकी संभावित समानताएँ पहचानता है।

शोधकर्ताओं ने वास्तविक दुनिया के ज्ञान ग्राफ़ पर प्रयोग किए, और परिणाम दिखाते हैं कि AutoAlign संस्थाओं के संरेखण कार्य में मौजूदा विधियों की तुलना में काफी बेहतर प्रदर्शन करता है। यह पार्टी खत्म होने के बाद की तरह है, जब मेहमानों ने अपने दोस्तों को खोज लिया, और पार्टी आयोजक को अत्यधिक प्रशंसा मिली।

प्रीडिकेट संरेखण (Predicate Alignment): AutoAlign प्रीडिकेट निकटता ग्राफ़ के माध्यम से विभिन्न ज्ञान ग्राफ़ में समान संबंधों के प्रीडिकेट के बीच समानता को सीखता है। यह ठीक उसी तरह है जैसे पार्टी आयोजक मेहमानों की समान रुचियों को देखकर उन्हें परिचित कराता है।

संस्थान संरेखण (Entity Alignment): AutoAlign पहले प्रत्येक ज्ञान ग्राफ़ की संस्थाओं की एम्बेडिंग को स्वतंत्र रूप से गणना करता है, फिर गुण आधारित संस्थाओं की समानता की गणना करके दोनों ज्ञान ग्राफ़ की संस्थाओं की एम्बेडिंग को समान वेक्टर स्थान में परिवर्तित करता है। यह ठीक उसी तरह है जैसे पार्टी आयोजक मेहमानों की उपस्थिति और व्यवहार को देखकर उनके दोस्तों की पहचान करता है।

संयुक्त शिक्षण (Joint Learning): AutoAlign प्रीडिकेट, संस्थाओं और गुणों की एम्बेडिंग को संयुक्त रूप से सीखकर संस्थाओं के संरेखण को और अधिक सटीक बनाता है। यह ठीक उसी तरह है जैसे पार्टी आयोजक पार्टी के दौरान अपनी परिचय रणनीतियों को लगातार समायोजित करता है, ताकि हर कोई अपने दोस्तों को खोज सके।

AutoAlign न केवल ज्ञान ग्राफ़ संरेखण कार्य में अपनी क्षमता को प्रदर्शित करता है, बल्कि ज्ञान ग्राफ़ पूर्णता जैसे व्यापक अनुप्रयोगों में अपनी संभावनाओं को भी प्रदर्शित करता है। शोधकर्ताओं का मानना है कि AutoAlign का भविष्य केवल ज्ञान ग्राफ़ तक सीमित नहीं हो सकता, बल्कि यह व्यापक ग्राफ़ या सुपरग्राफ़ अनुसंधान क्षेत्र में भी विस्तारित हो सकता है।

पेपर का पता: https://arxiv.org/abs/2307.11772