अली क्लाउड बाई लिआन ने Qwen2.5-Turbo में मिलियन लंबी पाठ मॉडल लॉन्च किया

AIbase基地

द्वारा प्रकाशितAI समाचार · 4 मिनट पढ़ें · Nov 21, 2024

200

अली क्लाउड बायालियन प्लेटफ़ॉर्म ने हाल ही में Qwen2.5-Turbo मिलियन लंबे टेक्स्ट मॉडल लॉन्च करने की घोषणा की है। Qwen2.5-Turbo मॉडल को टोंगयि कियानवेन टीम द्वारा विकसित किया गया है, जो 1000000 टोकन तक के सुपर लंबे संदर्भ को संसाधित करने का समर्थन करता है, जो 1000000 अंग्रेजी शब्दों या 1500000 चीनी वर्णों के बराबर है।

इस नए संस्करण के मॉडल ने लंबे टेक्स्ट खोज कार्यों में 100% सटीकता हासिल की है, और लंबे टेक्स्ट मूल्यांकन सेट RULER पर 93.1 अंक प्राप्त किए हैं, जो GPT-4 को पार करता है। LV-Eval, LongBench-Chat जैसे वास्तविक परिदृश्यों के करीब लंबे टेक्स्ट कार्यों में, Qwen2.5-Turbo अधिकांश आयामों में GPT-4o-mini को पार कर गया है। छोटे टेक्स्ट बेंचमार्क परीक्षणों में, Qwen2.5-Turbo का प्रदर्शन भी बहुत अच्छा रहा है, पहले के 1M टोकन संदर्भ लंबाई वाले ओपन-सोर्स मॉडल को काफी पीछे छोड़ते हुए।

微信截图_20241121082702.png

Qwen2.5-Turbo मॉडल के अनुप्रयोग परिदृश्य व्यापक हैं, जिसमें लंबे उपन्यासों की गहन समझ, बड़े पैमाने पर कोड सहायक, कई शोध पत्र पढ़ना आदि शामिल हैं, जो एक बार में 10 लंबे उपन्यास, 150 घंटे के भाषण稿 या 30000 पंक्तियों का कोड संसाधित कर सकते हैं। अनुमानित गति के मामले में, टोंगयि कियानवेन टीम ने विरल ध्यान तंत्र के माध्यम से गणना की मात्रा को लगभग 12.5 गुना कम कर दिया है, 1M टोकन संदर्भ के पहले शब्द को लौटाने का समय 4.9 मिनट से घटाकर 68 सेकंड कर दिया है, जिससे 4.3 गुना की गति में सुधार हुआ है।

अली क्लाउड बायालियन प्लेटफ़ॉर्म सभी उपयोगकर्ताओं को Qwen2.5-Turbo API को सीधे कॉल करने की क्षमता प्रदान करता है, और सीमित समय के लिए 10000000 टोकन की मात्रा मुफ्त में देता है। बाद में 1 मिलियन टोकन के उपयोग की लागत केवल 0.3 युआन है।

वर्तमान में, अली क्लाउड बायालियन प्लेटफ़ॉर्म ने Qwen, Llama, ChatGLM सहित 200 से अधिक प्रमुख घरेलू और अंतरराष्ट्रीय ओपन-सोर्स और क्लोज़-सोर्स बड़े मॉडल लॉन्च किए हैं, जो उपयोगकर्ताओं को सीधे कॉल करने, प्रशिक्षण में सुधार करने या RAG अनुप्रयोग बनाने का समर्थन करते हैं।

अली क्लाउड मोड में लॉन्चिना कक्षास्कीन का नवीनतम ओपन-सोर्स मल्टी-मॉडल मॉडल

वैश्विक डेवलपर्स का ध्यान फिर से चीन की ओर आकर्षित हुआ! अत्यधिक प्रतीक्षित वैश्विक डेवलपर सम्मेलन (जीडीसी) में, अली क्लाउड मोड समुदाय ने महत्वपूर्ण घोषणा की, कक्षास्कीन का नवीनतम ओपन-सोर्स मल्टी-मॉडल मॉडल पेश किया, जिसमें वैश्विक स्तर पर सबसे बड़े ओपन-सोर्स वीडियो जनरेशन मॉडल स्टेप-वीडियो-टी2वी, और उद्योग का पहला प्रोडक्ट-लेवल ओपन-सोर्स वॉयस इंटरएक्शन मॉडल स्टेप-ऑडियो शामिल है। यह समाचार तुरंत वैश्विक एआई ओपन-सोर्स समुदाय की हलचल पैदा कर दिया, जिससे यह फिर से चीन की कृत्रिम बुद्धिमत्ता क्षेत्र में मजबूत नवाचार क्षमता को उजागर करता है। चीन का सबसे बड़ा एआई

消息称阿里巴巴以3万美元收购QwenChat.com域名

हाल ही में, डोमेन सर्कल ने बताया कि अलीबाबा ने 30,000 अमेरिकी डॉलर (लगभग 2,18,000人民币) की कीमत में QwenChat.com डोमेन खरीदा है। हालांकि लेन-देन की राशि छोटी लगती है, लेकिन आश्चर्यजनक बात यह है कि इस डोमेन का रजिस्ट्रार केवल 10 डॉलर की लागत में इसे रखता है, और दो महीने में 3000 गुना लाभ प्राप्त कर चुका है। QwenChat.com डोमेन अलीबाबा के AI बड़े मॉडल '通义千问Qwen' के साथ उच्च स्तर पर मेल खाता है, और 'chat' चैटिंग सुविधा का संकेत देता है। अलीबाबा इस डोमेन के अधिग्रहण के बाद, संभवतः...

कई प्लेटफार्मों ने DeepSeek बड़े मॉडल को लॉन्च किया, आर्टिफिशियल इंटेलिजेंस तकनीक में नवाचार को आगे बढ़ाते हुए

हाल ही में, कई चीनी क्लाउड सेवा प्लेटफॉर्म ने DeepSeek बड़े मॉडल को लॉन्च किया, जो इस नई तकनीक के देश में व्यापक उपयोग का प्रतीक है। इस लॉन्च में बाइटडांस क्लाउड, हुआवेई क्लाउड, अली क्लाउड, टेन्सेंट क्लाउड, 360 डिजिटल सुरक्षा और युंझौ टेक्नोलॉजी जैसी कंपनियां शामिल हैं। उपयोगकर्ता विभिन्न प्लेटफार्मों पर DeepSeek-R1, DeepSeek-V3 जैसे उन्नत मॉडलों का अनुभव कर सकते हैं। लॉन्च इवेंट के दिन, बाइटडांस क्लाउड ने घोषणा की कि इसका 千帆 प्लेटफॉर्म आधिकारिक तौर पर DeepSeek-R1 और DeepS को लिस्ट कर दिया है।

अली क्लाउड द्वारा ओपन-सोर्स Qwen2.5-VL, दृश्य AI ने Claude 3.5 को पीछे छोड़ दिया

अली क्लाउड ने एक नया दृश्य मॉडल Qwen2.5-VL ओपन-सोर्स किया है, और 3B, 7B और 72B के तीन आकार संस्करण लॉन्च किए हैं। इसमें, फ्लैगशिप संस्करण Qwen2.5-VL-72B ने 13 प्रमुख परीक्षणों में दृश्य समझ का खिताब जीता, जिसने GPT-4o और Claude3.5 को पीछे छोड़ दिया। अली क्लाउड के आधिकारिक विवरण के अनुसार, नया Qwen2.5-VL छवि सामग्री को अधिक सटीकता से解析 कर सकता है, और 1 घंटे से अधिक की वीडियो समझ का समर्थन कर सकता है। यह मॉडल वीडियो में विशिष्ट घटनाओं को खोज सकता है, और वीडियो की अनियमितताओं को समझ सकता है।

AI समाचार