स्व-पुरस्कृत भाषा मॉडल

भाषा मॉडल स्व-पुरस्कृत प्रशिक्षण

सामान्य उत्पादउत्पादकताभाषा मॉडलस्व-पुरस्कार

यह उत्पाद एक स्व-पुरस्कृत भाषा मॉडल है, जो एक निर्णायक के रूप में LLM का उपयोग करके, मॉडल द्वारा प्रदान किए गए स्वयं के पुरस्कार संकेतों के माध्यम से प्रशिक्षित होता है। पुनरावृति DPO प्रशिक्षण के माध्यम से, मॉडल न केवल निर्देशों का पालन करने की क्षमता में सुधार करता है, बल्कि उच्च-गुणवत्ता वाले स्व-पुरस्कार भी प्रदान करता है। तीन पुनरावृत्तियों के फाइन-ट्यूनिंग के बाद, इस उत्पाद ने AlpacaEval 2.0 रैंकिंग में कई मौजूदा प्रणालियों को पीछे छोड़ दिया है, जिनमें Claude 2, Gemini Pro और GPT-4 0613 शामिल हैं। यह कार्य यद्यपि प्रारंभिक शोध ही है, लेकिन मॉडल के दो पहलुओं में निरंतर सुधार की संभावना का द्वार खोलता है।

Best AI Websites & Tools

स्व-पुरस्कृत भाषा मॉडल

स्व-पुरस्कृत भाषा मॉडल नवीनतम ट्रैफ़िक स्थिति

स्व-पुरस्कृत भाषा मॉडल विज़िट प्रवृत्ति

स्व-पुरस्कृत भाषा मॉडल विज़िट भौगोलिक वितरण

स्व-पुरस्कृत भाषा मॉडल ट्रैफ़िक स्रोत

स्व-पुरस्कृत भाषा मॉडल विकल्प

स्व-पुरस्कृत भाषा मॉडल — भाषा मॉडल स्व-पुरस्कृत प्रशिक्षण

ओपनमैनस — ओपनमैनस एक ओपन-सोर्स बुद्धिमान एजेंट प्रोजेक्ट है जिसका उपयोग बिना आमंत्रण कोड के किया जा सकता है।

Phi-4-mini-instruct — Phi-4-mini-instruct एक हल्का ओपन-सोर्स भाषा मॉडल है, जो उच्च-गुणवत्ता वाले निष्कर्षण-गहन डेटा पर केंद्रित है।

स्मिथरी — मॉडल संदर्भ प्रोटोकॉल सर्वर के माध्यम से भाषा मॉडल की क्षमताओं का विस्तार करता है।

DeepHermes-3-Llama-3-8B-पूर्वावलोकन — DeepHermes 3 एक बड़ा भाषा मॉडल है जो निष्कर्षण और सामान्य प्रतिक्रिया मोड दोनों का समर्थन करता है।

Lora — Lora एक मोबाइल उपकरणों के लिए अनुकूलित स्थानीय भाषा मॉडल है जो iOS और Android प्लेटफॉर्म का समर्थन करता है।

PaliGemma 2 मिश्रण — PaliGemma 2 मिश्रण एक बहुउद्देशीय दृश्य भाषा मॉडल है जो कई कार्यों और क्षेत्रों के लिए उपयुक्त है।

Mistral Saba — Mistral Saba एक मध्य पूर्व और दक्षिण एशिया के लिए बनाया गया क्षेत्रीय भाषा मॉडल है।

OLMoE ऐप — Ai2 OLMoE एक ओपन-सोर्स भाषा मॉडल ऐप है जो iOS डिवाइस पर चलता है।

Deeptrain — भाषा मॉडल और AI एजेंटों को वीडियो प्रोसेसिंग सेवाएँ प्रदान करता है, कई वीडियो स्रोतों का समर्थन करता है।

ReaderLM v2 — ReaderLM v2 एक HTML को Markdown और JSON में बदलने वाला अत्याधुनिक छोटा भाषा मॉडल है।

MiniMax-Text-01 — MiniMax-Text-01 एक शक्तिशाली भाषा मॉडल है, जिसमें 4560 अरब कुल पैरामीटर हैं, जो 40 लाख टोकन तक के संदर्भ को संभाल सकता है।

MiniMax-01 — एक शक्तिशाली भाषा मॉडल, जिसमें 4560 अरब कुल पैरामीटर हैं, जो 40 लाख टोकन तक के संदर्भ को संभाल सकता है।

पूर्णिमा (Pūrṇimā) — अपनी जेब में दस अरब पैरामीटर, निजी स्थानीय बड़े भाषा मॉडल के साथ चैट करें।

MiniCPM-o-2_6 — MiniCPM-o 2.6 एक शक्तिशाली बहु-मोडल बड़ा भाषा मॉडल है, जो दृश्य, वाक् और बहु-मोडल लाइव स्ट्रीमिंग के लिए उपयुक्त है।

MiniCPM-o — MiniCPM-o 2.6: एक GPT-4o-स्तरीय MLLM जो मोबाइल पर दृश्य, ध्वनि और बहु-मोडल लाइव स्ट्रीमिंग को सक्षम बनाता है।