InternVL2-8B-MPO-बहुविधा बड़ा भाषा मॉडल, बहुविधा तर्क क्षमता में सुधार

InternVL2-8B-MPO एक बहुविधा बड़ा भाषा मॉडल (MLLM) है, जो मिश्रित प्राथमिकता अनुकूलन (MPO) प्रक्रिया को शामिल करके मॉडल की बहुविधा तर्क क्षमता को बढ़ाता है। इस मॉडल में डेटा के संबंध में स्वचालित प्राथमिकता डेटा निर्माण पाइपलाइन तैयार की गई है, और MMPR नामक एक बड़ा बहुविधा तर्क प्राथमिकता डेटासेट बनाया गया है। मॉडल के संबंध में, InternVL2-8B-MPO InternVL2-8B से आरंभ किया गया है, और MMPR डेटासेट का उपयोग करके इसे बेहतर बनाया गया है, जिससे यह अधिक मजबूत बहुविधा तर्क क्षमता प्रदर्शित करता है, और भ्रम की घटनाएँ कम होती हैं। इस मॉडल ने MathVista पर 67.0% की सटीकता हासिल की है, जो InternVL2-8B से 8.7 अंक अधिक है, और यह InternVL2-76B (जो इससे 10 गुना बड़ा है) के करीब प्रदर्शन करता है।

AI समाचार

AI दैनिक

AI समयरेखा

अल हार्डवेयर

नवीनतम मामले

छवि संग्रह

वीडियो संग्रह

ऑडियो संग्रह

सामग्री संग्रह

नवीनतम ट्यूटोरियल

AI उत्पाद रैंकिंग

AI ट्रैफ़िक वृद्धि रैंकिंग

AI ट्रैफ़िक गिरावट रैंकिंग

AI साप्ताहिक रैंकिंग

संयुक्त राज्य अमेरिका

चीन

भारत

ब्राजील

छवि निर्माण

निजी सहायक

चरित्र निर्माण

वीडियो निर्माण

AI प्रोजेक्ट रैंकिंग

AI प्रोजेक्ट विकास रैंकिंग

AI डेवलपर रैंकिंग

AI संगठन रैंकिंग

डीपसीक

TTS

LLM

ChatGPT

अवलोकन

InternVL2-8B-MPO

InternVL2-8B-MPO नवीनतम ट्रैफ़िक स्थिति

InternVL2-8B-MPO विज़िट प्रवृत्ति

InternVL2-8B-MPO विज़िट भौगोलिक वितरण

InternVL2-8B-MPO ट्रैफ़िक स्रोत

InternVL2-8B-MPO विकल्प

InternVL2-8B-MPO — बहुविधा बड़ा भाषा मॉडल, बहुविधा तर्क क्षमता में सुधार

InternLM3-8B-Instruct — InternLM3-8B-Instruct एक 80 करोड़ पैरामीटर वाला खुला स्रोत निर्देश मॉडल है, जो सामान्य उपयोग और उन्नत तर्क के लिए है।

HuatuoGPT-o1-8B — उन्नत चिकित्सा क्षेत्र के लिए बड़ा भाषा मॉडल

हर्मिस 3 - लामा-3.1 70B — हर्मिस श्रृंखला का नवीनतम बड़ा भाषा मॉडल

NVLM 1.0 — अत्याधुनिक बहुविधा बड़ा भाषा मॉडल

Llama-3.2-11B-Vision — बहुविधा बड़ा भाषा मॉडल, जो छवि और पाठ संसाधन का समर्थन करता है।

lmms-finetune — बड़े बहुविधा मॉडल के सूक्ष्म-समायोजन के लिए एकीकृत कोड लाइब्रेरी

हिग्ग्स-लामा-3-70B — भूमिका निभाने के लिए अनुकूलित एक बड़ा भाषा मॉडल

ग्रोक-1.5 — ग्रोक-1.5 बेहतर तर्क क्षमता और 128,000 टोकन की संदर्भ लंबाई के साथ आता है।

ड्रीम 7B — ड्रीम 7B सबसे शक्तिशाली खुला प्रसार बड़ा भाषा मॉडल है।

o1-pro — o1-pro मॉडल बेहतर उत्तर प्रदान करने के लिए सुदृढीकरण शिक्षा द्वारा जटिल तर्क क्षमता को बढ़ाता है।

Argo — अपना खुद का बड़ा मॉडल आसानी से बनाएँ, विशेष बुद्धिमत्ता, केवल स्थानीय रूप से।

M2RAG — बहुविधा संदर्भ में पुनर्प्राप्ति-वर्धित पीढ़ी के लिए एक बेंचमार्क परीक्षण कोड भंडार।

SWE-RL — ओपन सोर्स सॉफ्टवेयर के विकास में बड़े भाषा मॉडल की अनुमान क्षमता को सुदृढीकरण अधिगम द्वारा बढ़ाना

Goedel-Prover — Goedel-Prover एक ओपन-सोर्स ऑटोमेटेड थ्योरम प्रूविंग मॉडल है जो गणितीय समस्याओं के औपचारिक प्रमाण पर केंद्रित है।

हुगिन-0125 — हुगिन-0125 एक 3.5 अरब पैरामीटर वाला छिपा हुआ चर चक्रीय गहराई मॉडल है, जो तर्क और कोड जनरेशन में कुशल है।

ऑम्निह्यूमन-1 — ऑम्निह्यूमन-1 एक बहुविधा ढाँचा है जो एकल मानव चित्र और गति संकेतों से मानव वीडियो उत्पन्न करता है।