rStar-गणित
छोटे भाषा मॉडल द्वारा आत्म-विकास और गहन चिंतन के माध्यम से गणितीय तर्क क्षमता हासिल करने के शोध परिणामों का प्रदर्शन करता है।
सामान्य उत्पादशिक्षाकृत्रिम बुद्धिमत्ताभाषा मॉडल
rStar-गणित एक शोध है जिसका उद्देश्य यह साबित करना है कि छोटे भाषा मॉडल (SLM) OpenAI के o1 मॉडल की गणितीय तर्क क्षमता से मुकाबला कर सकते हैं और यहां तक कि उससे आगे निकल सकते हैं, बिना किसी उच्च-स्तरीय मॉडल पर निर्भर हुए। यह शोध मोंटे कार्लो ट्री सर्च (MCTS) के माध्यम से "गहन चिंतन" को लागू करता है, जिसमें गणितीय रणनीति SLM को SLM-आधारित प्रक्रिया पुरस्कार मॉडल के मार्गदर्शन में परीक्षण करते समय खोज करता है। rStar-गणित दो SLM को प्रशिक्षित करने की चुनौतियों का समाधान करने के लिए तीन नवीन तरीके प्रस्तुत करता है, 4 राउंड आत्म-विकास और लाखों सिंथेटिक समाधानों के माध्यम से SLM की गणितीय तर्क क्षमता को अत्याधुनिक स्तर तक बढ़ाता है। इस मॉडल ने MATH बेंचमार्क परीक्षण में प्रदर्शन में उल्लेखनीय वृद्धि की है और AIME प्रतियोगिता में उत्कृष्ट प्रदर्शन किया है।
rStar-गणित नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
29742941
बाउंस दर
44.20%
प्रति विज़िट औसत पृष्ठ
5.9
औसत विज़िट अवधि
00:04:44