Vidu के लॉन्च के सौ दिन पूरे होने पर, Shengshu Technology गर्व से Vidu 1.5 के नए संस्करण की घोषणा करता है, जिसने विविध इनपुट को समझने और "संगति" की चुनौती को पार करने में विश्व स्तरीय प्रगति हासिल की है।

Vidu 1.5 का लॉन्च दृश्य मॉडल के लिए एक नए "संदर्भ" युग की शुरुआत का प्रतीक है, जो सामान्य कृत्रिम बुद्धिमत्ता (AGI) के आगमन को तेज करता है। Vidu ने वैश्विक स्तर पर अपने लॉन्च के समय से ही चरित्र संगति जनरेट करने की क्षमता हासिल की थी, जो वीडियो जनरेशन में महत्वपूर्ण दर्द बिंदुओं को हल करने के लिए चेहरे की विशेषताओं को लॉक करके काम करती है। सितंबर में, Vidu ने वैश्विक स्तर पर "विषय संगति" कार्यक्षमता का पहला संस्करण जारी किया, जिसने चेहरे की संगति को पूरे शरीर की संगति तक बढ़ाया और इसे जानवरों, वस्तुओं, आभासी पात्रों आदि जैसे किसी भी विषय पर लागू किया। Vidu की तकनीकी प्रगति मुख्य रूप से तीन क्षेत्रों में है: जटिल विषयों का सटीक नियंत्रण, चेहरे की विशेषताओं और गतिशील भावनाओं की स्वाभाविक संगति, और बहु-प्रमुख संगति।

微信截图_20241113135537.png

微信截图_20241113135531.png

Vidu 1.5 ने दृश्य मॉडल में एक नए "स्मार्ट उभरने" का प्रदर्शन किया है, जो इसकी शक्तिशाली संदर्भ सीखने की क्षमता को प्रदर्शित करता है। इसका मतलब है कि दृश्य मॉडल केवल समझने और कल्पना करने की क्षमता नहीं रखता, बल्कि उत्पादन प्रक्रिया में स्मृति प्रबंधन भी कर सकता है। Vidu 1.5 ने अपनी उद्योग में अग्रणी उत्पादन दक्षता को बनाए रखा है, 30 सेकंड से कम समय में एक वीडियो उत्पन्न कर सकता है। Vidu सार्वभौमिकता के सिद्धांत का पालन करता है, LLM (बड़े भाषा मॉडल) के अनुरूप डिज़ाइन दर्शन के साथ, सभी समस्याओं को दृश्य इनपुट और दृश्य आउटपुट की समस्याओं के रूप में एकीकृत करता है, एकल ट्रांसफार्मर का उपयोग करके लंबाई में भिन्न इनपुट और आउटपुट को एकीकृत रूप से मॉडल करता है, और वीडियो डेटा के संकुचन से बुद्धिमत्ता प्राप्त करता है।

Vidu 1.5 का लॉन्च न केवल वीडियो मॉडल की नियंत्रणीयता को बढ़ाता है, बल्कि लचीले बहुआयामी इनपुट के माध्यम से बहु-कोण, बहु-प्रमुख, बहु-तत्व संगति उत्पादन को भी सक्षम बनाता है। यह दृश्य बुद्धिमत्ता के उभरने का प्रतीक है, AGI के आगमन को तेज करता है। Vidu अब केवल एक उच्च गुणवत्ता, उच्च दक्षता वाला वीडियो जनरेटर नहीं है, बल्कि यह उत्पादन प्रक्रिया में संदर्भ जानकारी और स्मृति को भी शामिल कर सकता है, जो दृश्य मोड बुद्धिमत्ता में एक "बड़ा कदम" है। दृश्य मॉडल में अधिक मजबूत संज्ञानात्मक क्षमताएँ होंगी, जो AGI के लिए एक महत्वपूर्ण टुकड़ा बनेंगी।

अनुभव लिंक:www.vidu.studio