अली क्लाउड टोंग यी कियान वें फिर से ओपनस्रोत: मल्टी-मॉडल बड़ा मॉडल क्यूवेन-वीएल

亿邦动力

द्वारा प्रकाशितAI समाचार · 2 मिनट पढ़ें · Aug 25, 2023

25 अगस्त को, अली क्लाउड ने बड़े पैमाने पर विज़ुअल लैंग्वेज मॉडल Qwen-VL लॉन्च किया, जो चीनी और अंग्रेजी सहित कई भाषाओं का समर्थन करता है और टेक्स्ट और इमेज की संयुक्त समझ क्षमता रखता है। Qwen-VL अली क्लाउड के पहले के ओपन-सोर्स जनरल लैंग्वेज मॉडल Qwen-7B पर आधारित है। अन्य विज़ुअल लैंग्वेज मॉडलों की तुलना में, Qwen-VL ने विज़ुअल लोकेशन, इमेज में टेक्स्ट की समझ जैसी नई क्षमताएँ जोड़ी हैं। Qwen-VL ने GitHub पर 3400 से अधिक स्टार प्राप्त किए हैं, और डाउनलोड संख्या 400,000 से अधिक है। विज़ुअल लैंग्वेज मॉडल को सामान्य AI के महत्वपूर्ण विकास दिशा के रूप में देखा जाता है। उद्योग का मानना है कि मल्टी-मोडल इनपुट का समर्थन करने वाले मॉडल दुनिया की समझने की क्षमता को बढ़ा सकते हैं और उपयोग के दृश्य को विस्तारित कर सकते हैं। अली क्लाउड Qwen-VL के ओपन-सोर्स के माध्यम से सामान्य AI प्रौद्योगिकी की प्रगति को आगे बढ़ा रहा है।

अली क्लाउड मोड में लॉन्चिना कक्षास्कीन का नवीनतम ओपन-सोर्स मल्टी-मॉडल मॉडल

वैश्विक डेवलपर्स का ध्यान फिर से चीन की ओर आकर्षित हुआ! अत्यधिक प्रतीक्षित वैश्विक डेवलपर सम्मेलन (जीडीसी) में, अली क्लाउड मोड समुदाय ने महत्वपूर्ण घोषणा की, कक्षास्कीन का नवीनतम ओपन-सोर्स मल्टी-मॉडल मॉडल पेश किया, जिसमें वैश्विक स्तर पर सबसे बड़े ओपन-सोर्स वीडियो जनरेशन मॉडल स्टेप-वीडियो-टी2वी, और उद्योग का पहला प्रोडक्ट-लेवल ओपन-सोर्स वॉयस इंटरएक्शन मॉडल स्टेप-ऑडियो शामिल है। यह समाचार तुरंत वैश्विक एआई ओपन-सोर्स समुदाय की हलचल पैदा कर दिया, जिससे यह फिर से चीन की कृत्रिम बुद्धिमत्ता क्षेत्र में मजबूत नवाचार क्षमता को उजागर करता है। चीन का सबसे बड़ा एआई

गूगल DeepMind ने 100 बिलियन दृश्य भाषा डेटा सेट WebLI-100B लॉन्च किया

गूगल DeepMind टीम ने आधिकारिक रूप से WebLI-100B डेटा सेट लॉन्च किया है, जो 1000 अरब चित्र - पाठ युग्मों का एक विशाल डेटा सेट है, जिसका उद्देश्य कृत्रिम बुद्धिमत्ता दृश्य भाषा मॉडल की सांस्कृतिक विविधता और बहुभाषिकता को बढ़ाना है। इस डेटा सेट के माध्यम से, शोधकर्ता विभिन्न संस्कृतियों और भाषा पर्यावरण में दृश्य भाषा मॉडल के प्रदर्शन में सुधार करने की आशा करते हैं, साथ ही विभिन्न उपसमूहों के बीच प्रदर्शन के अंतर को कम करने का प्रयास करते हैं, ताकि कृत्रिम बुद्धिमत्ता की समावेशिता बढ़ाई जा सके। दृश्य भाषा मॉडल (VLMs) को यह सीखने के लिए बड़े पैमाने पर डेटा सेट पर निर्भर रहना पड़ता है कि कैसे जोड़ना है।

AI समाचार

अली क्लाउड टोंग यी कियान वें फिर से ओपनस्रोत: मल्टी-मॉडल बड़ा मॉडल क्यूवेन-वीएल

亿邦动力

संबंधित AI समाचार अनुशंसाएँ

मैनस के संस्थापक शाओ होंग: 90 के दशक के AI स्टार, अपने पूर्ववर्ती लिआंग वेनफेंग से कम उम्र के

मैनस बीटा लॉन्च: मोनिका टीम द्वारा लॉन्च किया गया यूनिवर्सल एआई एजेंट चर्चा में है

अली क्लाउड मोड में लॉन्चिना कक्षास्कीन का नवीनतम ओपन-सोर्स मल्टी-मॉडल मॉडल

गूगल DeepMind ने 100 बिलियन दृश्य भाषा डेटा सेट WebLI-100B लॉन्च किया