जी-वीएल मल्टी-मोडल भाषा मॉडल लॉन्च किया गया दो संस्करणों के साथ

站长之家

द्वारा प्रकाशितAI समाचार · 2 मिनट पढ़ें · Jan 23, 2024

零一万物 Yi-VL मल्टी-मोडल भाषा मॉडल零一万物 Yi श्रृंखला मॉडल परिवार का एक नया सदस्य है, जो चित्र और पाठ को समझने और संवाद उत्पन्न करने में उत्कृष्ट क्षमताएँ रखता है। Yi-VL मॉडल ने अंग्रेजी डेटा सेट MMMU और चीनी डेटा सेट CMMMU पर प्रमुख उपलब्धियाँ हासिल की हैं, जो जटिल अंतःविषय कार्यों में अपनी ताकत को प्रदर्शित करता है। Yi-VL-34B ने नए मल्टी-मोडल बेंचमार्क परीक्षण MMMU में 41.6% की सटीकता के साथ अन्य मल्टी-मोडल बड़े मॉडलों को पीछे छोड़ दिया, जो अंतःविषय ज्ञान को समझने और लागू करने की मजबूत क्षमता को दर्शाता है। Yi-VL मॉडल ओपन-सोर्स LLaVA आर्किटेक्चर पर आधारित है, जिसमें विज़न ट्रांसफार्मर (ViT), प्रोजेक्शन मॉड्यूल और बड़े पैमाने पर भाषा मॉडल Yi-34B-Chat और Yi-6B-Chat शामिल हैं। ViT का उपयोग चित्र को कोडित करने के लिए किया जाता है, प्रोजेक्शन मॉड्यूल चित्र विशेषताओं और पाठ विशेषताओं के स्थान संरेखण की क्षमता को लागू करता है, और बड़े पैमाने पर भाषा मॉडल शक्तिशाली भाषा समझ और उत्पन्न करने की क्षमता प्रदान करता है।

अमेज़न ने नए प्रकार के मल्टी-मोडल भाषा मॉडल “Olympus” का विकास किया है जो AWS सम्मेलन में पेश हो सकता है

हाल ही में रिपोर्ट्स के अनुसार, अमेज़न कंपनी एक नए मल्टी-मोडल बड़े भाषा मॉडल का विकास कर रही है जिसका नाम “Olympus” है, और यह संभावित रूप से अगले सप्ताह AWS re:Invent सम्मेलन में औपचारिक रूप से पेश किया जा सकता है। theinformation की रिपोर्ट के अनुसार, इस एल्गोरिदम का आंतरिक कोड नाम “Olympus” है। पिछले नवंबर में, रॉयटर्स ने रिपोर्ट किया था कि अमेज़न ने “Olympus” नाम के एक बड़े भाषा मॉडल के प्रशिक्षण में करोड़ों डॉलर लगाए हैं, और इस मॉडल के पैरामीटर की संख्या 2 ट्रिलियन तक है।

सिंगापुर नेशनल यूनिवर्सिटी ने ओपन-सोर्स मल्टी-मोडल भाषा मॉडल NExT-GPT जारी किया, मल्टीमीडिया एआई एप्लिकेशन के विकास में सहायता करता है

NExT-GPT सिंगापुर नेशनल यूनिवर्सिटी द्वारा ओपन-सोर्स किया गया मल्टी-मोडल भाषा मॉडल है, जो टेक्स्ट, इमेज, वीडियो और ऑडियो को प्रोसेस करने का समर्थन करता है, मल्टीमीडिया आर्टिफिशियल इंटेलिजेंस एप्लिकेशन के लिए मजबूत समर्थन प्रदान करता है। यह एक तीन-स्तरीय आर्किटेक्चर का उपयोग करता है, जिसमें रेखीय प्रक्षिप्ति, विकुना LLM कोर और मोड विशेष परिवर्तन परत शामिल है, मध्य स्तर के प्रशिक्षण के लिए MosIT तकनीक का उपयोग किया जाता है। ओपन-सोर्स योगदान शोधकर्ताओं और डेवलपर्स को मल्टी-मोडल इनपुट वाले एप्लिकेशन बनाने में सक्षम बनाता है, संभावित अनुप्रयोग क्षेत्रों की एक विस्तृत श्रृंखला है। NExT-GPT की अनोखी विशेषता यह है कि यह उपयोगकर्ता के अनुरोध के अनुसार मोड उत्पन्न कर सकता है।

AI समाचार

जी-वीएल मल्टी-मोडल भाषा मॉडल लॉन्च किया गया दो संस्करणों के साथ

站长之家

संबंधित AI समाचार अनुशंसाएँ

अमेज़न ने नए प्रकार के मल्टी-मोडल भाषा मॉडल “Olympus” का विकास किया है जो AWS सम्मेलन में पेश हो सकता है