अली क्लाउड द्वारा ओपन-सोर्स Qwen2.5-VL, दृश्य AI ने Claude 3.5 को पीछे छोड़ दिया

AIbase基地

द्वारा प्रकाशितAI समाचार · 4 मिनट पढ़ें · Jan 29, 2025

412

अली क्लाउड ने एक नया विज़ुअल मॉडल Qwen2.5-VL ओपन-सोर्स किया है, जिसमें 3B, 7B और 72B के तीन आकार के संस्करण पेश किए गए हैं।

जिसमें, फ्लैगशिप संस्करण Qwen2.5-VL-72B ने 13 प्रमुख परीक्षणों में विज़ुअल समझ में चैंपियन का खिताब जीता, जो GPT-4o और Claude3.5 से आगे निकल गया। अली क्लाउड का आधिकारिक परिचय है कि नया Qwen2.5-VL छवि सामग्री को अधिक सटीकता से解析 कर सकता है और एक घंटे से अधिक वीडियो समझने का समर्थन करता है। यह मॉडल वीडियो में विशिष्ट घटनाओं की खोज कर सकता है और वीडियो के विभिन्न समय अवधि के मुख्य बिंदुओं का सारांश प्रदान कर सकता है, जिससे उपयोगकर्ताओं को वीडियो में महत्वपूर्ण जानकारी जल्दी और कुशलता से निकालने में मदद मिलती है।

अली क्लाउड Qwen2.5-VL ओपन-सोर्स: सबसे मजबूत विज़ुअल एआई GPT-4o को पार करता है

इसके अलावा, Qwen2.5-VL को बिना किसी ट्यूनिंग के एक एआई विज़ुअल एजेंट (Visual Agents) में बदलने की क्षमता है, जो मोबाइल और कंप्यूटर को नियंत्रित कर सकता है, जैसे कि निर्दिष्ट मित्र को शुभकामनाएं भेजना, कंप्यूटर पर फोटो संपादित करना, मोबाइल पर टिकट बुक करना आदि। Qwen2.5-VL केवल सामान्य वस्तुओं जैसे फूल, पक्षी, मछली और कीड़े को पहचानने में ही नहीं, बल्कि छवि में पाठ, चार्ट, आइकन, ग्राफिक्स और लेआउट का विश्लेषण करने में भी सक्षम है। अली क्लाउड ने Qwen2.5-VL की OCR पहचान क्षमता को बढ़ाया है, जिससे विभिन्न परिदृश्यों, भाषाओं और दिशाओं में पाठ पहचान और पाठ स्थानांतरण क्षमता को सशक्त किया गया है।

अली क्लाउड Qwen2.5-VL ओपन-सोर्स: सबसे मजबूत विज़ुअल एआई GPT-4o को पार करता है

साथ ही, सूचना निष्कर्षण क्षमता में भी बड़े पैमाने पर वृद्धि की गई है, ताकि बढ़ती हुई योग्यता समीक्षा, वित्तीय व्यवसाय आदि के डिजिटल और बुद्धिमान आवश्यकताओं को पूरा किया जा सके।

मुख्य बिंदु:
🌟 अली क्लाउड ने Qwen2.5-VL को ओपन-सोर्स किया, 3B, 7B और 72B के तीन संस्करण पेश किए।
📈 Qwen2.5-VL-72B ने विज़ुअल समझ परीक्षण में GPT-4o और Claude3.5 को पार किया।
👀 Qwen2.5-VL 1 घंटे से अधिक वीडियो समझने का समर्थन करता है, OCR पहचान क्षमता को बढ़ाता है।

अली क्लाउड मोड में लॉन्चिना कक्षास्कीन का नवीनतम ओपन-सोर्स मल्टी-मॉडल मॉडल

वैश्विक डेवलपर्स का ध्यान फिर से चीन की ओर आकर्षित हुआ! अत्यधिक प्रतीक्षित वैश्विक डेवलपर सम्मेलन (जीडीसी) में, अली क्लाउड मोड समुदाय ने महत्वपूर्ण घोषणा की, कक्षास्कीन का नवीनतम ओपन-सोर्स मल्टी-मॉडल मॉडल पेश किया, जिसमें वैश्विक स्तर पर सबसे बड़े ओपन-सोर्स वीडियो जनरेशन मॉडल स्टेप-वीडियो-टी2वी, और उद्योग का पहला प्रोडक्ट-लेवल ओपन-सोर्स वॉयस इंटरएक्शन मॉडल स्टेप-ऑडियो शामिल है। यह समाचार तुरंत वैश्विक एआई ओपन-सोर्स समुदाय की हलचल पैदा कर दिया, जिससे यह फिर से चीन की कृत्रिम बुद्धिमत्ता क्षेत्र में मजबूत नवाचार क्षमता को उजागर करता है। चीन का सबसे बड़ा एआई

कई प्लेटफार्मों ने DeepSeek बड़े मॉडल को लॉन्च किया, आर्टिफिशियल इंटेलिजेंस तकनीक में नवाचार को आगे बढ़ाते हुए

हाल ही में, कई चीनी क्लाउड सेवा प्लेटफॉर्म ने DeepSeek बड़े मॉडल को लॉन्च किया, जो इस नई तकनीक के देश में व्यापक उपयोग का प्रतीक है। इस लॉन्च में बाइटडांस क्लाउड, हुआवेई क्लाउड, अली क्लाउड, टेन्सेंट क्लाउड, 360 डिजिटल सुरक्षा और युंझौ टेक्नोलॉजी जैसी कंपनियां शामिल हैं। उपयोगकर्ता विभिन्न प्लेटफार्मों पर DeepSeek-R1, DeepSeek-V3 जैसे उन्नत मॉडलों का अनुभव कर सकते हैं। लॉन्च इवेंट के दिन, बाइटडांस क्लाउड ने घोषणा की कि इसका 千帆 प्लेटफॉर्म आधिकारिक तौर पर DeepSeek-R1 और DeepS को लिस्ट कर दिया है।

अली क्लाउड Qwen2.5-1M ओपन-सोर्स रिलीज़: 10 लाख संदर्भ लंबाई मॉडल का आगमन

DeepSeek R1 के बाद, अली क्लाउड की टोङ्ति कियानवेन टीम ने अभी हाल ही में अपने नवीनतम ओपन-सोर्स मॉडल Qwen2.5-1M की घोषणा की, जिसने फिर से उद्योग में ध्यान आकर्षित किया। इस रिलीज़ में Qwen2.5-1M श्रृंखला में दो ओपन-सोर्स मॉडल शामिल हैं: Qwen2.5-7B-Instruct-1M और Qwen2.5-14B-Instruct-1M। यह टोङ्ति कियानवेन द्वारा पहले बार लाया गया मॉडल है जो मूल रूप से एक मिलियन टोकन संदर्भ लंबाई का समर्थन करता है, और निष्पादन गति में महत्वपूर्ण सुधार किया गया है।

अली क्लाउड ने पूरी तरह से नया गणितीय तर्क मॉडल Qwen2.5-Math-PRM लॉन्च किया, 7B संस्करण ने GPT-4o को पार किया

आज, अली क्लाउड की टोंगी टीम ने पूरी तरह से नए गणितीय तर्क प्रक्रिया इनाम मॉडल Qwen2.5-Math-PRM का आधिकारिक रूप से शुभारंभ किया। यह मॉडल 72B और 7B दो आकारों में उपलब्ध है, और इसके प्रदर्शन ने समान खुली स्रोत प्रक्रिया इनाम मॉडल की तुलना में स्पष्ट रूप से बेहतर परिणाम दिए हैं, विशेष रूप से तर्क की गलतियों की पहचान में। Qwen2.5-Math-PRM का 7B संस्करण ने उद्योग में प्रचलित GPT-4o को आश्चर्यजनक रूप से पार किया, यह उपलब्धि अली क्लाउड के तर्क मॉडल के विकास में महत्वपूर्ण कदम को दर्शाती है।