डौबाओ बड़े मॉडल परिवार का पूर्ण उन्नयन, दृश्य समझ मॉडल और संगीत 4.0 मॉडल की भारी शुरुआत

2024年12月18日的 वोल्केन इंजन FORCE पावर कॉन्फ्रेंस में, वोल्केन इंजन ने डौबाओ बड़े मॉडल परिवार के लिए एक व्यापक उन्नयन की घोषणा की और एक नया दृष्टि समझ मॉडल जारी किया।

वोल्केन इंजन के राष्ट्रपति तान दाई ने कहा कि डौबाओ बड़े मॉडल का दैनिक टोकन उपयोग पिछले कुछ महीनों में तेजी से बढ़ा है, जो 40 ट्रिलियन से अधिक हो गया है, जो मई में लॉन्च होने के बाद 33 गुना बढ़ गया है। यह वृद्धि प्रवृत्ति दर्शाती है कि डौबाओ बड़े मॉडल का विभिन्न अनुप्रयोग परिदृश्यों में व्यापक उपयोग हो रहा है।

इस बार, वोल्केन इंजन ने दृष्टि समझ मॉडल को पेश करके उपयोगकर्ताओं को टेक्स्ट और इमेज के प्रश्न एक साथ इनपुट करने की अनुमति दी, जिससे मॉडल को एकीकृत रूप से समझने और सटीक उत्तर देने की क्षमता मिली। यह नवाचार अनुप्रयोग विकास प्रक्रिया को काफी सरल बना देगा और बड़े मॉडल के अधिक परिदृश्यों में क्षमता को सक्रिय करेगा।

दृष्टि समझ मॉडल में सामग्री पहचान की क्षमता अधिक मजबूत है, यह केवल छवि में वस्तुओं की श्रेणी, आकार आदि जैसे मूल तत्वों की पहचान कर सकता है, बल्कि वस्तुओं के बीच संबंध, स्थानिक लेआउट और दृश्य की समग्र अर्थ को भी समझ सकता है। जैसे कि छाया की पहचान, प्राकृतिक ज्ञान की पहचान आदि।

दृष्टि समझ मॉडल में समझने और तर्क करने की क्षमता अधिक मजबूत है, यह केवल सामग्री की बेहतर पहचान नहीं कर सकता, बल्कि पहचानी गई टेक्स्ट और इमेज जानकारी के आधार पर जटिल तार्किक गणनाएँ भी कर सकता है, जैसे: चार्ट तर्क, भौतिकी तर्क।

इसके अलावा, इसमें अधिक सूक्ष्म दृष्टि वर्णन क्षमता है, जो छवि जानकारी के आधार पर, छवि में प्रस्तुत सामग्री का अधिक सूक्ष्म वर्णन कर सकती है, और विभिन्न शैलियों की रचनाएँ कर सकती है, जैसे छवि निर्माण, छवि कविता निर्माण आदि।

डौबाओ दृष्टि समझ मॉडल शिक्षा, पर्यटन और ई-कॉमर्स जैसे कई क्षेत्रों में व्यापक अनुप्रयोग संभावनाएँ प्रदर्शित करता है। उदाहरण के लिए, शिक्षा के क्षेत्र में, मॉडल छात्रों को लेखन और विज्ञान ज्ञान को अनुकूलित करने में मदद कर सकता है; पर्यटन के क्षेत्र में, मॉडल पर्यटकों को विदेशी मेनू का अनुवाद और भवन की पृष्ठभूमि ज्ञान की व्याख्या प्रदान कर सकता है; ई-कॉमर्स मार्केटिंग में, यह व्यापारियों को उत्पाद विशेषताओं का विस्तृत वर्णन करने में मदद कर सकता है, जिससे विज्ञापन के प्रभाव में सुधार होता है।

दृष्टि समझ मॉडल के उपयोग की लागत भी बहुत सस्ती है, प्रति हजार टोकन की कीमत 0.003 युआन है, जो उद्योग के औसत मूल्य से 85% कम है। यह मूल्य स्तर हर एक रुपये को 284 720P छवियों तक संसाधित करने की अनुमति देता है, जो दृष्टि समझ तकनीक के "ली युग" में प्रवेश का प्रतीक है। इसके अलावा, वोल्केन इंजन ने कंपनियों और डेवलपर्स को 15,000 बार की प्रारंभिक ट्रैफिक सहायता भी प्रदान की है, जिससे उन्हें इस तकनीक का बेहतर उपयोग करने में मदद मिल सके।

इस सम्मेलन में, वोल्केन इंजन ने केवल दृष्टि समझ मॉडल का अनावरण नहीं किया, बल्कि अन्य कई मॉडलों का भी उन्नयन किया। डौबाओ सामान्य मॉडल प्रो की समग्र कार्य क्षमता मई में 32% बढ़ी है, और तर्क, निर्देश पालन, कोड और गणित जैसे क्षेत्रों में भी महत्वपूर्ण सुधार हुए हैं। साथ ही, डौबाओ・वीडियो जनरेशन मॉडल 2025年1月 में सार्वजनिक सेवा के लिए खुल जाएगा, कंपनियाँ इसका उपयोग करने के लिए आरक्षित कर सकती हैं।

कंपनियों की जानकारी प्राप्त करने और खोज सिफारिश क्षमताओं को बढ़ाने के लिए, वोल्केन इंजन ने संपूर्ण एआई खोज सेवा भी पेश की, जो कंपनियों को जानकारी और उपयोगकर्ता आवश्यकताओं को बेहतर तरीके से जोड़ने में मदद करती है, जिससे विभिन्न उद्योगों के स्मार्ट परिवर्तन को बढ़ावा मिलता है।

मुख्य बिंदु:
🔍 डौबाओ बड़े मॉडल का दैनिक टोकन उपयोग 40 ट्रिलियन तक पहुँच गया, जो मई में 33 गुना बढ़ा।
💡 नए लॉन्च किए गए दृष्टि समझ मॉडल में टेक्स्ट और इमेज का एक साथ इनपुट समर्थन है, जो शिक्षा, पर्यटन और ई-कॉमर्स जैसे क्षेत्रों के लिए उपयुक्त है।
💰 प्रति हजार टोकन का उपयोग लागत केवल 0.003 युआन है, जो उद्योग के औसत मूल्य से काफी कम है।

AI समाचार

डौबाओ बड़े मॉडल परिवार का पूर्ण उन्नयन, दृश्य समझ मॉडल और संगीत 4.0 मॉडल की भारी शुरुआत

AIbase基地

संबंधित AI समाचार अनुशंसाएँ

बाइटडांस का AGI उन्नयन: डौबाओ बड़े मॉडल टीम ने 'सीड एज' टीम का गठन किया, AI के भविष्य की खोज

बाइटडांस ने डौबाओ बड़े मॉडल 1.5Pro का अनावरण किया, प्रदर्शन GPT-4o और क्लॉड3.5Sonnet से आगे

डौबाओ बड़े मॉडल का दावा GPT-4 के साथ तालमेल तक पहुँच गया, 300 मिलियन लंबे टेक्स्ट क्षमता का पहली बार खुलासा

लेनोवो एआई डेस्कटॉप सहायक ने डौबाओ बड़े मॉडल को जोड़ा