माइक्रोसॉफ्ट ने अपनी वेबसाइट पर ग्राफ़-आधारित RAG (रिट्रीवल-एन्हांस्ड जनरेशन) — GraphRAG को ओपन-सोर्स किया है। यह प्रणाली एंटरिटी नॉलेज ग्राफ़ का निर्माण करके बड़े मॉडल की खोज, प्रश्न-उत्तर, सारांश, और तर्क करने की क्षमताओं को बढ़ाती है, विशेष रूप से बड़े पैमाने पर डेटा सेट को संभालने में कुशल है।

image.png

प्रोजेक्ट लिंक: https://top.aibase.com/tool/graphrag

परंपरागत RAG सिस्टम बाहरी डेटा स्रोतों को संभालते समय स्थानीय टेक्स्ट अंशों की खोज पर अधिक निर्भर करता है, जिससे पूरे डेटा सेट का समग्र दृश्य नहीं मिल पाता। जबकि GraphRAG एंटरिटी नॉलेज ग्राफ़ का निर्माण करके, बड़े मॉडल को टेक्स्ट में जटिल संबंधों और इंटरैक्शन को बेहतर ढंग से पकड़ने में मदद करता है, जिससे वैश्विक खोज क्षमताओं को प्राप्त किया जा सकता है।

GraphRAG का मुख्य हिस्सा दो चरणों में शामिल है: एंटरिटी नॉलेज ग्राफ़ का निर्माण और सामुदायिक सारांश का निर्माण। सामुदायिक सारांश के माध्यम से, GraphRAG पूरे डेटा सेट से संबंधित जानकारी निकालने और अधिक व्यापक और सटीक उत्तर उत्पन्न करने में सक्षम है। इसके अलावा, GraphRAG को टोकन की बहुत कम आवश्यकता होती है, जिसका मतलब है कि यह डेवलपर्स को काफी लागत बचाने में मदद कर सकता है।

माइक्रोसॉफ्ट ने एक 1 मिलियन टोकन, अत्यधिक जटिल संरचना वाले डेटा सेट पर GraphRAG का व्यापक परीक्षण किया, और परिणामों ने दिखाया कि GraphRAG समग्रता और विविधता परीक्षणों में Naive RAG जैसे तरीकों को पार कर गया, और पॉडकास्ट ट्रांसक्रिप्ट और समाचार लेख डेटा सेट पर उच्च स्तर पर प्रदर्शन किया, जो वर्तमान में सबसे अच्छे RAG तरीकों में से एक है।

मुख्य बिंदु:

- 💡 GraphRAG एंटरिटी नॉलेज ग्राफ़ का निर्माण करके बड़े मॉडल की खोज, प्रश्न-उत्तर, सारांश, और तर्क करने की क्षमताओं को बढ़ाता है, विशेष रूप से बड़े पैमाने पर डेटा सेट को संभालने में कुशल है।

- 💡 GraphRAG का मुख्य हिस्सा एंटरिटी नॉलेज ग्राफ़ का निर्माण और सामुदायिक सारांश का निर्माण है, जो डेटा सेट से संबंधित जानकारी निकालने और अधिक व्यापक और सटीक उत्तर उत्पन्न करने में मदद करता है।

- 💡 GraphRAG को टोकन की बहुत कम आवश्यकता होती है, जो डेवलपर्स को लागत बचाने में मदद करता है। व्यापक परीक्षण में उत्कृष्ट प्रदर्शन करता है, और वर्तमान में सबसे अच्छे RAG तरीकों में से एक है।