हाल ही में, कुन्लुन वानवे ने सिंगापुर के नांयांग टेक्नोलॉजिकल यूनिवर्सिटी के साथ मिलकर Q * नामक एक एल्गोरिदम विकसित किया है, जो मौजूदा बड़े मॉडल की अनुमानित क्षमताओं को काफी बढ़ा सकता है। Q * विभिन्न डेटा सेटों पर छोटे मॉडल को उनके बड़े समकक्षों की तुलना में कई गुना बेहतर अनुमानित क्षमता प्राप्त करने में मदद करता है, जिससे मॉडल के प्रदर्शन में काफी सुधार होता है, साथ ही यह कंप्यूटिंग संसाधनों की आवश्यकता को भी काफी कम करता है, जिससे कृत्रिम बुद्धिमत्ता के व्यापक अनुप्रयोगों के लिए नए अवसर खुलते हैं और एक कुशल बुद्धिमत्ता के नए युग की शुरुआत होती है।

कुन्लुन वानवे

शोधकर्ताओं ने पेपर "Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning" में Q * ढांचे का प्रस्ताव रखा है, जो बड़े भाषा मॉडल के अनुमानित ट्रैक को कई अवस्थाओं में विभाजित करता है और A * खोज एल्गोरिदम का उपयोग करके समग्र योजना बनाता है, जिससे ओपन-सोर्स मॉडल की अनुमानित कार्यों पर प्रदर्शन में सुधार होता है।

विशेष रूप से, पथ लागत के कार्य और संचयी पुरस्कार के कार्य को परिभाषित करके, ऐतिहासिक स्थिति के लाभ और भविष्य की अपेक्षित लाभ पर समग्र विचार किया गया है। प्रयोगों में, Q * ने विभिन्न मॉडलों को विभिन्न डेटा सेटों पर महत्वपूर्ण सटीकता सुधार प्राप्त करने में मदद की है, जिससे कुछ प्रसिद्ध मॉडलों को पार किया गया है।

वर्तमान में, Q * का शोध अभी प्रारंभिक चरण में है, और इसमें सुधार की गुंजाइश है। भविष्य में, कुन्लुन वानवे आगे की अनुसंधान जारी रखेगा, घरेलू ओपन-सोर्स मॉडल की अनुमानित क्षमता को बढ़ाने के लिए, कृत्रिम बुद्धिमत्ता प्रौद्योगिकी के विकास में अधिक संभावनाएं लाने के लिए।

पेपर लिंक:

https://arxiv.org/abs/2406.14283