2024年12月18日的 वोल्केन इंजन FORCE पावर कॉन्फ्रेंस में, वोल्केन इंजन ने डौबाओ बड़े मॉडल परिवार के लिए एक व्यापक उन्नयन की घोषणा की और एक नया दृष्टि समझ मॉडल जारी किया।

image.png

वोल्केन इंजन के राष्ट्रपति तान दाई ने कहा कि डौबाओ बड़े मॉडल का दैनिक टोकन उपयोग पिछले कुछ महीनों में तेजी से बढ़ा है, जो 40 ट्रिलियन से अधिक हो गया है, जो मई में लॉन्च होने के बाद 33 गुना बढ़ गया है। यह वृद्धि प्रवृत्ति दर्शाती है कि डौबाओ बड़े मॉडल का विभिन्न अनुप्रयोग परिदृश्यों में व्यापक उपयोग हो रहा है।

image.png

इस बार, वोल्केन इंजन ने दृष्टि समझ मॉडल को पेश करके उपयोगकर्ताओं को टेक्स्ट और इमेज के प्रश्न एक साथ इनपुट करने की अनुमति दी, जिससे मॉडल को एकीकृत रूप से समझने और सटीक उत्तर देने की क्षमता मिली। यह नवाचार अनुप्रयोग विकास प्रक्रिया को काफी सरल बना देगा और बड़े मॉडल के अधिक परिदृश्यों में क्षमता को सक्रिय करेगा।

दृष्टि समझ मॉडल में सामग्री पहचान की क्षमता अधिक मजबूत है, यह केवल छवि में वस्तुओं की श्रेणी, आकार आदि जैसे मूल तत्वों की पहचान कर सकता है, बल्कि वस्तुओं के बीच संबंध, स्थानिक लेआउट और दृश्य की समग्र अर्थ को भी समझ सकता है। जैसे कि छाया की पहचान, प्राकृतिक ज्ञान की पहचान आदि।

image.png

दृष्टि समझ मॉडल में समझने और तर्क करने की क्षमता अधिक मजबूत है, यह केवल सामग्री की बेहतर पहचान नहीं कर सकता, बल्कि पहचानी गई टेक्स्ट और इमेज जानकारी के आधार पर जटिल तार्किक गणनाएँ भी कर सकता है, जैसे: चार्ट तर्क, भौतिकी तर्क।

image.png

इसके अलावा, इसमें अधिक सूक्ष्म दृष्टि वर्णन क्षमता है, जो छवि जानकारी के आधार पर, छवि में प्रस्तुत सामग्री का अधिक सूक्ष्म वर्णन कर सकती है, और विभिन्न शैलियों की रचनाएँ कर सकती है, जैसे छवि निर्माण, छवि कविता निर्माण आदि।

image.png

डौबाओ दृष्टि समझ मॉडल शिक्षा, पर्यटन और ई-कॉमर्स जैसे कई क्षेत्रों में व्यापक अनुप्रयोग संभावनाएँ प्रदर्शित करता है। उदाहरण के लिए, शिक्षा के क्षेत्र में, मॉडल छात्रों को लेखन और विज्ञान ज्ञान को अनुकूलित करने में मदद कर सकता है; पर्यटन के क्षेत्र में, मॉडल पर्यटकों को विदेशी मेनू का अनुवाद और भवन की पृष्ठभूमि ज्ञान की व्याख्या प्रदान कर सकता है; ई-कॉमर्स मार्केटिंग में, यह व्यापारियों को उत्पाद विशेषताओं का विस्तृत वर्णन करने में मदद कर सकता है, जिससे विज्ञापन के प्रभाव में सुधार होता है।

दृष्टि समझ मॉडल के उपयोग की लागत भी बहुत सस्ती है, प्रति हजार टोकन की कीमत 0.003 युआन है, जो उद्योग के औसत मूल्य से 85% कम है। यह मूल्य स्तर हर एक रुपये को 284 720P छवियों तक संसाधित करने की अनुमति देता है, जो दृष्टि समझ तकनीक के "ली युग" में प्रवेश का प्रतीक है। इसके अलावा, वोल्केन इंजन ने कंपनियों और डेवलपर्स को 15,000 बार की प्रारंभिक ट्रैफिक सहायता भी प्रदान की है, जिससे उन्हें इस तकनीक का बेहतर उपयोग करने में मदद मिल सके।

image.png

इस सम्मेलन में, वोल्केन इंजन ने केवल दृष्टि समझ मॉडल का अनावरण नहीं किया, बल्कि अन्य कई मॉडलों का भी उन्नयन किया। डौबाओ सामान्य मॉडल प्रो की समग्र कार्य क्षमता मई में 32% बढ़ी है, और तर्क, निर्देश पालन, कोड और गणित जैसे क्षेत्रों में भी महत्वपूर्ण सुधार हुए हैं। साथ ही, डौबाओ・वीडियो जनरेशन मॉडल 2025年1月 में सार्वजनिक सेवा के लिए खुल जाएगा, कंपनियाँ इसका उपयोग करने के लिए आरक्षित कर सकती हैं।

image.png

image.png

कंपनियों की जानकारी प्राप्त करने और खोज सिफारिश क्षमताओं को बढ़ाने के लिए, वोल्केन इंजन ने संपूर्ण एआई खोज सेवा भी पेश की, जो कंपनियों को जानकारी और उपयोगकर्ता आवश्यकताओं को बेहतर तरीके से जोड़ने में मदद करती है, जिससे विभिन्न उद्योगों के स्मार्ट परिवर्तन को बढ़ावा मिलता है।

मुख्य बिंदु:

🔍 डौबाओ बड़े मॉडल का दैनिक टोकन उपयोग 40 ट्रिलियन तक पहुँच गया, जो मई में 33 गुना बढ़ा।

💡 नए लॉन्च किए गए दृष्टि समझ मॉडल में टेक्स्ट और इमेज का एक साथ इनपुट समर्थन है, जो शिक्षा, पर्यटन और ई-कॉमर्स जैसे क्षेत्रों के लिए उपयुक्त है।

💰 प्रति हजार टोकन का उपयोग लागत केवल 0.003 युआन है, जो उद्योग के औसत मूल्य से काफी कम है।