जियुआन अनुसंधान संस्थान ने हाल ही में तीन नए वेक्टर मॉडल जारी किए हैं, जो वेक्टर खोज कार्यों में उत्कृष्ट प्रदर्शन करते हैं और कई परीक्षण मानकों पर सर्वश्रेष्ठ स्तर को नवीनीकरण करते हैं। ये तीन मॉडल हैं:

  1. BGE-EN-ICL: एक अंग्रेजी वेक्टर मॉडल, जो कार्य-संबंधित प्रश्न-डॉक्यूमेंट उदाहरणों को कम संख्या में उदाहरणों के रूप में पेश करके मॉडल की अर्थव्यवस्था को बढ़ाता है।

  2. BGE-Multilingual-Gemma2: एक बहुभाषी वेक्टर मॉडल, जो विशेष रूप से हिंदी और अंग्रेजी क्षमताओं में सुधार करने में उत्कृष्ट है।

  3. BGE-Reranker-v2.5-Gemma2-Lightweight: एक बहुभाषी पुनर्व्यवस्थित मॉडल, जो डिज़ाइन को अनुकूलित करके, स्तर-वार पूर्व-आउटपुट और टोकन संकुचन का समर्थन करता है, जिससे कंप्यूटिंग संसाधनों की बचत होती है।

ये मॉडल बड़े भाषा मॉडल पर आधारित हैं और उत्कृष्ट क्षेत्र अनुकूलन क्षमता और व्यापक सामान्यीकरण प्रदर्शन रखते हैं। वे संदर्भात्मक शिक्षण क्षमता और आसुत तकनीक का उपयोग करते हैं, जिससे मॉडल की समग्र प्रदर्शन और खोज कार्यों में क्षमता में सुधार होता है। BGE-Reranker-v2.5-Gemma2-Lightweight मॉडल विशेष रूप से हल्के डिज़ाइन पर ध्यान केंद्रित करता है, जिससे यह उत्कृष्ट प्रदर्शन बनाए रखते हुए और भी अधिक कुशल बनता है।

प्रयोगात्मक परिणामों में, ये मॉडल MTEB, BEIR, AIR-Bench जैसे कई परीक्षण मानकों में उत्कृष्ट प्रदर्शन करते हैं। BGE-Multilingual-Gemma2 बहुभाषी क्षमता में विशेष रूप से उत्कृष्ट है, खासकर हिंदी और अंग्रेजी क्षमताओं में सुधार के मामले में। BGE-EN-ICL विशेष रूप से कुछ-शॉट प्रदर्शन में उत्कृष्ट है। BGE-Reranker-v2.5-Gemma2-Lightweight पुनर्व्यवस्था कार्यों में भी बेहतर परिणाम प्राप्त करता है, और कंप्यूटिंग संसाधनों की बचत करते हुए उत्कृष्ट प्रभाव सुनिश्चित करता है।

मॉडल लिंक

(1) BGE-EN-ICL: 

https://huggingface.co/BAAI/bge-en-icl

(2) BGE-Multilingual-Gemma2: 

https://huggingface.co/BAAI/bge-multilingual-gemma2

(3) BGE-Reranker-v2.5-Gemma2-Lightweight: 

https://huggingface.co/BAAI/bge-reranker-v2.5-gemma2-lightweight