जियुआन अनुसंधान संस्थान ने हाल ही में तीन नए वेक्टर मॉडल जारी किए हैं, जो वेक्टर खोज कार्यों में उत्कृष्ट प्रदर्शन करते हैं और कई परीक्षण मानकों पर सर्वश्रेष्ठ स्तर को नवीनीकरण करते हैं। ये तीन मॉडल हैं:
BGE-EN-ICL: एक अंग्रेजी वेक्टर मॉडल, जो कार्य-संबंधित प्रश्न-डॉक्यूमेंट उदाहरणों को कम संख्या में उदाहरणों के रूप में पेश करके मॉडल की अर्थव्यवस्था को बढ़ाता है।
BGE-Multilingual-Gemma2: एक बहुभाषी वेक्टर मॉडल, जो विशेष रूप से हिंदी और अंग्रेजी क्षमताओं में सुधार करने में उत्कृष्ट है।
BGE-Reranker-v2.5-Gemma2-Lightweight: एक बहुभाषी पुनर्व्यवस्थित मॉडल, जो डिज़ाइन को अनुकूलित करके, स्तर-वार पूर्व-आउटपुट और टोकन संकुचन का समर्थन करता है, जिससे कंप्यूटिंग संसाधनों की बचत होती है।
ये मॉडल बड़े भाषा मॉडल पर आधारित हैं और उत्कृष्ट क्षेत्र अनुकूलन क्षमता और व्यापक सामान्यीकरण प्रदर्शन रखते हैं। वे संदर्भात्मक शिक्षण क्षमता और आसुत तकनीक का उपयोग करते हैं, जिससे मॉडल की समग्र प्रदर्शन और खोज कार्यों में क्षमता में सुधार होता है। BGE-Reranker-v2.5-Gemma2-Lightweight मॉडल विशेष रूप से हल्के डिज़ाइन पर ध्यान केंद्रित करता है, जिससे यह उत्कृष्ट प्रदर्शन बनाए रखते हुए और भी अधिक कुशल बनता है।
प्रयोगात्मक परिणामों में, ये मॉडल MTEB, BEIR, AIR-Bench जैसे कई परीक्षण मानकों में उत्कृष्ट प्रदर्शन करते हैं। BGE-Multilingual-Gemma2 बहुभाषी क्षमता में विशेष रूप से उत्कृष्ट है, खासकर हिंदी और अंग्रेजी क्षमताओं में सुधार के मामले में। BGE-EN-ICL विशेष रूप से कुछ-शॉट प्रदर्शन में उत्कृष्ट है। BGE-Reranker-v2.5-Gemma2-Lightweight पुनर्व्यवस्था कार्यों में भी बेहतर परिणाम प्राप्त करता है, और कंप्यूटिंग संसाधनों की बचत करते हुए उत्कृष्ट प्रभाव सुनिश्चित करता है।
मॉडल लिंक
(1) BGE-EN-ICL:
https://huggingface.co/BAAI/bge-en-icl
(2) BGE-Multilingual-Gemma2:
https://huggingface.co/BAAI/bge-multilingual-gemma2
(3) BGE-Reranker-v2.5-Gemma2-Lightweight:
https://huggingface.co/BAAI/bge-reranker-v2.5-gemma2-lightweight