Vidu के लॉन्च के सौ दिन पूरे होने पर, Shengshu Technology गर्व से Vidu 1.5 के नए संस्करण की घोषणा करता है, जिसने विविध इनपुट को समझने और "संगति" की चुनौती को पार करने में विश्व स्तरीय प्रगति हासिल की है।
Vidu 1.5 का लॉन्च दृश्य मॉडल के लिए एक नए "संदर्भ" युग की शुरुआत का प्रतीक है, जो सामान्य कृत्रिम बुद्धिमत्ता (AGI) के आगमन को तेज करता है। Vidu ने वैश्विक स्तर पर अपने लॉन्च के समय से ही चरित्र संगति जनरेट करने की क्षमता हासिल की थी, जो वीडियो जनरेशन में महत्वपूर्ण दर्द बिंदुओं को हल करने के लिए चेहरे की विशेषताओं को लॉक करके काम करती है। सितंबर में, Vidu ने वैश्विक स्तर पर "विषय संगति" कार्यक्षमता का पहला संस्करण जारी किया, जिसने चेहरे की संगति को पूरे शरीर की संगति तक बढ़ाया और इसे जानवरों, वस्तुओं, आभासी पात्रों आदि जैसे किसी भी विषय पर लागू किया। Vidu की तकनीकी प्रगति मुख्य रूप से तीन क्षेत्रों में है: जटिल विषयों का सटीक नियंत्रण, चेहरे की विशेषताओं और गतिशील भावनाओं की स्वाभाविक संगति, और बहु-प्रमुख संगति।
Vidu 1.5 ने दृश्य मॉडल में एक नए "स्मार्ट उभरने" का प्रदर्शन किया है, जो इसकी शक्तिशाली संदर्भ सीखने की क्षमता को प्रदर्शित करता है। इसका मतलब है कि दृश्य मॉडल केवल समझने और कल्पना करने की क्षमता नहीं रखता, बल्कि उत्पादन प्रक्रिया में स्मृति प्रबंधन भी कर सकता है। Vidu 1.5 ने अपनी उद्योग में अग्रणी उत्पादन दक्षता को बनाए रखा है, 30 सेकंड से कम समय में एक वीडियो उत्पन्न कर सकता है। Vidu सार्वभौमिकता के सिद्धांत का पालन करता है, LLM (बड़े भाषा मॉडल) के अनुरूप डिज़ाइन दर्शन के साथ, सभी समस्याओं को दृश्य इनपुट और दृश्य आउटपुट की समस्याओं के रूप में एकीकृत करता है, एकल ट्रांसफार्मर का उपयोग करके लंबाई में भिन्न इनपुट और आउटपुट को एकीकृत रूप से मॉडल करता है, और वीडियो डेटा के संकुचन से बुद्धिमत्ता प्राप्त करता है।
Vidu 1.5 का लॉन्च न केवल वीडियो मॉडल की नियंत्रणीयता को बढ़ाता है, बल्कि लचीले बहुआयामी इनपुट के माध्यम से बहु-कोण, बहु-प्रमुख, बहु-तत्व संगति उत्पादन को भी सक्षम बनाता है। यह दृश्य बुद्धिमत्ता के उभरने का प्रतीक है, AGI के आगमन को तेज करता है। Vidu अब केवल एक उच्च गुणवत्ता, उच्च दक्षता वाला वीडियो जनरेटर नहीं है, बल्कि यह उत्पादन प्रक्रिया में संदर्भ जानकारी और स्मृति को भी शामिल कर सकता है, जो दृश्य मोड बुद्धिमत्ता में एक "बड़ा कदम" है। दृश्य मॉडल में अधिक मजबूत संज्ञानात्मक क्षमताएँ होंगी, जो AGI के लिए एक महत्वपूर्ण टुकड़ा बनेंगी।
अनुभव लिंक:www.vidu.studio