रूलर (RULER)

लंबे पाठ भाषा मॉडल की तार्किकता का मूल्यांकन करने के लिए एक उचित मानदंड।

सामान्य उत्पादउत्पादकतालंबा पाठभाषा मॉडल

रूलर एक नया संश्लेषित मानदंड है जो लंबे पाठ भाषा मॉडल के लिए अधिक व्यापक मूल्यांकन प्रदान करता है। यह सामान्य पुनर्प्राप्ति परीक्षणों का विस्तार करता है, जिसमें विभिन्न प्रकार और मात्रा में सूचना बिंदु शामिल हैं। इसके अतिरिक्त, रूलर नए कार्य वर्गों को प्रस्तुत करता है, जैसे बहु-छलांग ट्रैकिंग और समेकन, जो संदर्भ से परे व्यवहार का परीक्षण करने के लिए हैं। रूलर पर 10 लंबे पाठ भाषा मॉडल का मूल्यांकन किया गया है और 13 प्रतिनिधि कार्यों में प्रदर्शन प्राप्त किया गया है। हालांकि इन मॉडलों ने सामान्य पुनर्प्राप्ति परीक्षणों में लगभग पूर्ण सटीकता प्राप्त की है, लेकिन संदर्भ लंबाई में वृद्धि के साथ, उनका प्रदर्शन बहुत खराब हो गया है। केवल चार मॉडल (GPT-4, Command-R, Yi-34B और Mixtral) 32K लंबाई पर काफी अच्छा प्रदर्शन करते हैं। हम लंबे पाठ भाषा मॉडल के व्यापक मूल्यांकन को बढ़ावा देने के लिए रूलर को सार्वजनिक रूप से उपलब्ध करा रहे हैं।

Best AI Websites & Tools

रूलर (RULER)

रूलर (RULER) नवीनतम ट्रैफ़िक स्थिति

रूलर (RULER) विज़िट प्रवृत्ति

रूलर (RULER) विज़िट भौगोलिक वितरण

रूलर (RULER) ट्रैफ़िक स्रोत

रूलर (RULER) विकल्प

रूलर (RULER) — लंबे पाठ भाषा मॉडल की तार्किकता का मूल्यांकन करने के लिए एक उचित मानदंड।

ओपनकम्पास 2.0 विशाल भाषा मॉडल लीडरबोर्ड — विशाल भाषा मॉडल रैंकिंग, मॉडल के प्रदर्शन का वास्तविक समय मूल्यांकन।

ओपनमैनस — ओपनमैनस एक ओपन-सोर्स बुद्धिमान एजेंट प्रोजेक्ट है जिसका उपयोग बिना आमंत्रण कोड के किया जा सकता है।

Phi-4-mini-instruct — Phi-4-mini-instruct एक हल्का ओपन-सोर्स भाषा मॉडल है, जो उच्च-गुणवत्ता वाले निष्कर्षण-गहन डेटा पर केंद्रित है।

स्मिथरी — मॉडल संदर्भ प्रोटोकॉल सर्वर के माध्यम से भाषा मॉडल की क्षमताओं का विस्तार करता है।

DeepHermes-3-Llama-3-8B-पूर्वावलोकन — DeepHermes 3 एक बड़ा भाषा मॉडल है जो निष्कर्षण और सामान्य प्रतिक्रिया मोड दोनों का समर्थन करता है।

Lora — Lora एक मोबाइल उपकरणों के लिए अनुकूलित स्थानीय भाषा मॉडल है जो iOS और Android प्लेटफॉर्म का समर्थन करता है।

PaliGemma 2 मिश्रण — PaliGemma 2 मिश्रण एक बहुउद्देशीय दृश्य भाषा मॉडल है जो कई कार्यों और क्षेत्रों के लिए उपयुक्त है।

Mistral Saba — Mistral Saba एक मध्य पूर्व और दक्षिण एशिया के लिए बनाया गया क्षेत्रीय भाषा मॉडल है।

OLMoE ऐप — Ai2 OLMoE एक ओपन-सोर्स भाषा मॉडल ऐप है जो iOS डिवाइस पर चलता है।

Deeptrain — भाषा मॉडल और AI एजेंटों को वीडियो प्रोसेसिंग सेवाएँ प्रदान करता है, कई वीडियो स्रोतों का समर्थन करता है।

ReaderLM v2 — ReaderLM v2 एक HTML को Markdown और JSON में बदलने वाला अत्याधुनिक छोटा भाषा मॉडल है।

MiniMax-Text-01 — MiniMax-Text-01 एक शक्तिशाली भाषा मॉडल है, जिसमें 4560 अरब कुल पैरामीटर हैं, जो 40 लाख टोकन तक के संदर्भ को संभाल सकता है।

MiniMax-01 — एक शक्तिशाली भाषा मॉडल, जिसमें 4560 अरब कुल पैरामीटर हैं, जो 40 लाख टोकन तक के संदर्भ को संभाल सकता है।

पूर्णिमा (Pūrṇimā) — अपनी जेब में दस अरब पैरामीटर, निजी स्थानीय बड़े भाषा मॉडल के साथ चैट करें।