विधु 1.5 संस्करण का विमोचन: 'बहु-विषय संगति' की समस्या का समाधान

AIbase基地

द्वारा प्रकाशितAI समाचार · 5 मिनट पढ़ें · Nov 13, 2024

541

Vidu के लॉन्च के सौ दिन पूरे होने पर, Shengshu Technology गर्व से Vidu 1.5 के नए संस्करण की घोषणा करता है, जिसने विविध इनपुट को समझने और "संगति" की चुनौती को पार करने में विश्व स्तरीय प्रगति हासिल की है।

Vidu 1.5 का लॉन्च दृश्य मॉडल के लिए एक नए "संदर्भ" युग की शुरुआत का प्रतीक है, जो सामान्य कृत्रिम बुद्धिमत्ता (AGI) के आगमन को तेज करता है। Vidu ने वैश्विक स्तर पर अपने लॉन्च के समय से ही चरित्र संगति जनरेट करने की क्षमता हासिल की थी, जो वीडियो जनरेशन में महत्वपूर्ण दर्द बिंदुओं को हल करने के लिए चेहरे की विशेषताओं को लॉक करके काम करती है। सितंबर में, Vidu ने वैश्विक स्तर पर "विषय संगति" कार्यक्षमता का पहला संस्करण जारी किया, जिसने चेहरे की संगति को पूरे शरीर की संगति तक बढ़ाया और इसे जानवरों, वस्तुओं, आभासी पात्रों आदि जैसे किसी भी विषय पर लागू किया। Vidu की तकनीकी प्रगति मुख्य रूप से तीन क्षेत्रों में है: जटिल विषयों का सटीक नियंत्रण, चेहरे की विशेषताओं और गतिशील भावनाओं की स्वाभाविक संगति, और बहु-प्रमुख संगति।

微信截图_20241113135537.png

微信截图_20241113135531.png

Vidu 1.5 ने दृश्य मॉडल में एक नए "स्मार्ट उभरने" का प्रदर्शन किया है, जो इसकी शक्तिशाली संदर्भ सीखने की क्षमता को प्रदर्शित करता है। इसका मतलब है कि दृश्य मॉडल केवल समझने और कल्पना करने की क्षमता नहीं रखता, बल्कि उत्पादन प्रक्रिया में स्मृति प्रबंधन भी कर सकता है। Vidu 1.5 ने अपनी उद्योग में अग्रणी उत्पादन दक्षता को बनाए रखा है, 30 सेकंड से कम समय में एक वीडियो उत्पन्न कर सकता है। Vidu सार्वभौमिकता के सिद्धांत का पालन करता है, LLM (बड़े भाषा मॉडल) के अनुरूप डिज़ाइन दर्शन के साथ, सभी समस्याओं को दृश्य इनपुट और दृश्य आउटपुट की समस्याओं के रूप में एकीकृत करता है, एकल ट्रांसफार्मर का उपयोग करके लंबाई में भिन्न इनपुट और आउटपुट को एकीकृत रूप से मॉडल करता है, और वीडियो डेटा के संकुचन से बुद्धिमत्ता प्राप्त करता है।

Vidu 1.5 का लॉन्च न केवल वीडियो मॉडल की नियंत्रणीयता को बढ़ाता है, बल्कि लचीले बहुआयामी इनपुट के माध्यम से बहु-कोण, बहु-प्रमुख, बहु-तत्व संगति उत्पादन को भी सक्षम बनाता है। यह दृश्य बुद्धिमत्ता के उभरने का प्रतीक है, AGI के आगमन को तेज करता है। Vidu अब केवल एक उच्च गुणवत्ता, उच्च दक्षता वाला वीडियो जनरेटर नहीं है, बल्कि यह उत्पादन प्रक्रिया में संदर्भ जानकारी और स्मृति को भी शामिल कर सकता है, जो दृश्य मोड बुद्धिमत्ता में एक "बड़ा कदम" है। दृश्य मॉडल में अधिक मजबूत संज्ञानात्मक क्षमताएँ होंगी, जो AGI के लिए एक महत्वपूर्ण टुकड़ा बनेंगी।

अनुभव लिंक:www.vidu.studio

विधु एजीआई विषय संगति संख्यात्मक विज्ञान

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

अमेज़ॅन के एजीआई प्रमुख का कहना है कि एआई व्यवसाय के हर कोने में है

बारसिलोना में मोबाइल वर्ल्ड कांग्रेस में बोलते हुए, अमेज़ॅन के आर्टिफिशियल इंटेलिजेंस जनरल पर्पस टेक्नोलॉजीज के वीपी विशाल शर्मा ने कहा कि आर्टिफिशियल इंटेलिजेंस (एआई) ने व्यापक रूप से...

Mar 4, 2025

क्या एआई भाषाई निर्भरता से मुक्त हो सकता है? ट्यूरिंग पुरस्कार विजेता बेंजियो और लेकॉन एजीआई के भविष्य पर विवाद करते हैं

कृत्रिम बुद्धिमत्ता एक विवादास्पद और अपेक्षाओं से भरे विकास चरण से गुजर रही है। हाल ही में, अकादमिक जगत में एआई की सोचने की क्षमता और भाषा की प्रकृति पर गहन चर्चा हुई है, जिसमें ट्यूरिंग पुरस्कार विजेता योशुआ बेंजियो और यान लेकॉन के दृष्टिकोण विशेष रूप से ध्यान आकर्षित करते हैं। वर्तमान एआई विकास की प्रवृत्तियाँ उत्साहजनक हैं। प्रमुख प्रौद्योगिकी कंपनियाँ अपने ध्यान केंद्रित करने में सरल भाषा मॉडल से अधिक जटिल तर्क और सोचने की क्षमताओं की ओर बढ़ रही हैं। OpenAI के o1 मॉडल का उदाहरण लें, जिसने गणित और कोडिंग के क्षेत्र में उल्लेखनीय प्रगति की है, जो इसका प्रमाण है। इस परिवर्तन के पीछे की

Dec 6, 2024

1.3k

माइक्रोसॉफ्ट के एआई प्रमुख का ओपनएआई में जॉइन करना, पूर्व सीटीओ नेतृत्व में स्टार्टअप की योजना बना रहा है!

टेक्नोलॉजी क्षेत्र में, कुछ ऐसे जबरदस्त चेहरे सामने आते हैं, इस बार ओपनएआई और माइक्रोसॉफ्ट के एआई विशेषज्ञों की बारी है। सुना है कि माइक्रोसॉफ्ट के एआई उपाध्यक्ष सेबेस्टियन ब्यूबैक जल्द ही ओपनएआई में शामिल होने वाले हैं, वह रहस्यमय एजीआई (सामान्य कृत्रिम बुद्धिमत्ता) का सपना पूरा करने के लिए तैयार हैं। और इस बीच, हाल ही में ओपनएआई की मुख्य तकनीकी अधिकारी मIRA मुराती भी अपने स्टार्टअप की योजना बना रही हैं, सुना है कि वह ओपनएआई से लोगों को लाने का भी सोच रही हैं।

Oct 15, 2024

1.0k

विधु वीडियो निर्माण मॉडल का ओपन API बैदू क़ियानफान बड़े मॉडल प्लेटफ़ॉर्म के साथ समन्वय में आया

आज आयोजित बैदू क्लाउड इंटेलिजेंस सम्मेलन में, विधु टेक्नोलॉजी के सह-संस्थापक और CEO तांग जिया यू ने घोषणा की कि देश का पहला वीडियो बड़ा मॉडल विधु आधिकारिक रूप से API खोल रहा है और बैदू बुद्धिमान क्लाउड क़ियानफान बड़े मॉडल प्लेटफ़ॉर्म में शामिल हो रहा है, जो इस प्लेटफ़ॉर्म का पहला वीडियो बड़ा मॉडल है। विधु की स्वचालित वीडियो निर्माण तकनीक में उच्च गतिशीलता, बहु-शैलीकरण और अत्यधिक विचारण जैसी अग्रणी विशेषताएँ हैं, और यह वैश्विक स्तर पर "विषय संदर्भ" कार्यक्षमता लॉन्च करने वाला पहला है, जो वीडियो मॉडल की स्थिरता उत्पन्न करने की चुनौती को प्रभावी ढंग से हल करता है। जुलाई के अंत से लॉन्च होने के बाद, अब तक इसे हजारों उद्यम उपयोगकर्ताओं से जुड़ने के लिए प्राप्त हुआ है।

Sep 25, 2024

2.1k

मानव-आकार का रोबोट कंपनी 'त्वरित विकास' ने 100 मिलियन का प्री-ए राउंड फंडिंग पूरा किया, द्विपदी रोबोट विकास पर ध्यान केंद्रित किया

मानव-आकार के रोबोट अनुसंधान और विकास पर केंद्रित तकनीकी कंपनी 'त्वरित विकास' ने 100 मिलियन स्तर का प्री-ए राउंड फंडिंग पूरा किया, जिसमें निवेशक पीआन टाइम्स, मिनयिन इंटरनेशनल, ज़िंगुआनकुन साइंस सिटी और आईकैनएक्स फंड शामिल हैं, और इंग्नो एंजेल ने सह-निवेश किया। यह धन मुख्य रूप से सामान्य अनुप्रयोगों के लिए आधार बनाने और सॉफ़्टवेयर विकास क्षमताओं को बढ़ाने के लिए उपयोग किया जाएगा। CEO Cheng Hao ने बताया कि एआई द्वारा संचालित मानव-आकार के रोबोटों की बाढ़, विशेष रूप से सामान्य कृत्रिम बुद्धिमत्ता (AGI) के वाहक की मांग के कारण, मानव-आकार के रोबोटों को विशेषताओं से सामान्यता की ओर स्थानांतरित करने के लिए प्रेरित कर रही है। कंपनी का पहला चरण वाणिज्यिक स्थिति सामान्य दो पैरों वाले रोबोट और विकासकर्ताओं को प्रदान करने के लिए है।

Sep 11, 2024

1.6k

पूर्व माइक्रोसॉफ्ट वैश्विक अनुसंधान भागीदार टोंग ज़िन एजीआई नवशास्त्री अनुत्ताकॉन में शामिल हुए

एजीआई स्टार्टअप अनुत्ताकॉन ने घोषणा की कि टोंग ज़िन और वांग यूयांग शामिल हुए हैं, टोंग ज़िन मुख्य शोधकर्ता के रूप में और वांग यूयांग उपयोगकर्ता पारिस्थितिकी के राष्ट्रपति के रूप में कार्य करेंगे। दोनों ही उद्योग के शीर्ष प्रतिभा हैं, टोंग ज़िन पूर्व में माइक्रोसॉफ्ट के वैश्विक अनुसंधान भागीदार रहे हैं, जबकि वांग यूयांग पूर्व में बी-स्टेशन के उपाध्यक्ष रहे हैं। अनुत्ताकॉन एआई प्रौद्योगिकी पर केंद्रित है, आभासी विश्व अनुभव और एजीआई उत्पादों का विकास कर रहा है। यह कदम कंपनी की एजीआई क्षेत्र में महत्वाकांक्षाओं और शीर्ष एआई प्रतिभाओं की भारी मांग को दर्शाता है।

Aug 26, 2024

5.3k

एनथ्रोपिक का नवीनतम शोध: एआई धोखाधड़ी मुद्दा मानवता के अंत का संकेत नहीं है

एनथ्रोपिक का नवीनतम पत्र एआई द्वारा धोखाधड़ी की अवधारणा को उजागर करता है, जो गर्मागर्म बहस का कारण बनता है। यह शोध बड़े भाषा मॉडल की धोखाधड़ी व्यवहार के चारों ओर केंद्रित है, और सुरक्षा प्रशिक्षण में इसकी निरंतर मौजूदगी का गहन विश्लेषण करता है। प्रयोगों में असंगत मॉडल बनाए गए, जानबूझकर बैकडोर प्रशिक्षण के माध्यम से धोखाधड़ी मॉडल का निर्माण किया गया, जो स्मार्ट एजेंटों द्वारा मानवता के लिए संभावित खतरे के बारे में चिंताओं को जन्म देता है। पत्र में समाधान पेश किए गए हैं, जैसे कि प्रतिकूल प्रशिक्षण, इनपुट विसंगतियों को खोजने, ट्रिगर पुनर्निर्माण आदि, जो धोखाधड़ी व्यवहार का सामना करने के लिए विभिन्न रास्ते प्रदान करते हैं। शोध यह जोर देता है कि हालांकि संभावित खतरे हैं, लेकिन प्रभावी तरीकों के माध्यम से कृत्रिम बुद्धिमत्ता की सुरक्षा सुनिश्चित की जा सकती है।

Jan 22, 2024

690

डीपसीक ने ओपन सोर्स कोड बड़े मॉडल डीपसीक कोडर जारी किया

डीपसीक (डीप खोज) ने ओपन सोर्स कोड बड़े मॉडल डीपसीक कोडर जारी किया। डीपसीक कोडर एक स्मार्ट कोड सहायक है, जो विभिन्न प्रकार के कोड उत्पन्न कर सकता है। डीपसीक कोडर ने हगिंग फेस और गिटहब पर ओपन सोर्स किया है। अंतर्राष्ट्रीय प्राधिकृत डेटासेट के परीक्षणों में डीपसीक कोडर ने उत्कृष्ट प्रदर्शन किया। डीपसीक AGI (आर्टिफिशियल जनरल इंटेलिजेंस) के स्वभाव का अन्वेषण करने के लिए प्रतिबद्ध है और अधिक शोध परिणाम जारी करने की योजना बना रहा है।

Nov 6, 2023

3.3k

फुदान एनएलपी प्रयोगशाला ने मिहायो के साथ मिलकर एआई एजेंट्स की स्थिति और भविष्य की व्याख्या की: बड़े मॉडल

🧠 अनुसंधान पृष्ठभूमि: एजीआई विकास पथ पाँच स्तरों में विभाजित है, एलएलएमएस तीसरे स्तर पर पहुँच गए हैं लेकिन चौथे स्तर पर पहुँचने के लिए संदर्भ और कार्यक्षेत्र की आवश्यकता है। 🌟 एजेंट संरचना: नियंत्रण पक्ष (एलएलएमएस), अनुभव पक्ष, और क्रियान्वयन पक्ष तीनों का संयोजन सूचना प्रसंस्करण, निर्णय लेने और पर्यावरण के साथ बातचीत के लिए होता है। 📈 अनुप्रयोग परिदृश्यों: एकल एजेंट दिनचर्या कार्य, नवाचार मार्गदर्शी, जीवनचक्र मार्गदर्शी तीन स्तर; बहु एजेंट सहयोगात्मक और प्रतिकूल इंटरैक्शन; मानव-यांत्रिकी इंटरैक्शन मार्गदर्शन-निष्पादन और सहयोगी दोनों मॉडल। 🚀 एजेंट समाज: व्यक्तिगत व्यवहार + समूह व्यवहार तीन तत्व व्यक्तित्व।

Oct 11, 2023

2.8k

सार्वभौम बुद्धिमत्ता में एजीआई स्टार्टअप में शामिल हुए सटन, बड़ी मॉडल पर निर्भर नहीं होने का दावा

легендарный программист кармак и отец усиленного обучения сutton совместно основали стартап в области иска Искусственного интеллекта Keen Technologies, их цель - продемонстрировать жизнеспособность универсального искусственного интеллекта общественности к 2030 году. Кармак и Сатон планируют не полагаться на большие модели, а сосредоточиться на онлайн-обучении в реальном времени и верят, что исходный код AGI может быть написан одним человеком на всего лишь несколько десятков тысяч строк. Кармак и Сатон считают, что текущая разработка AGI ограничена зависимостью от больших данных и большой вычислительной мощности, они планируют использовать модульную и распределенную архитектуру и также...

Oct 8, 2023

490

AI समाचार

AI दैनिक

AI समयरेखा

अल हार्डवेयर

नवीनतम मामले

छवि संग्रह

वीडियो संग्रह

ऑडियो संग्रह

सामग्री संग्रह

नवीनतम ट्यूटोरियल

AI उत्पाद रैंकिंग

AI ट्रैफ़िक वृद्धि रैंकिंग

AI ट्रैफ़िक गिरावट रैंकिंग

AI साप्ताहिक रैंकिंग

संयुक्त राज्य अमेरिका

चीन

भारत

ब्राजील

छवि निर्माण

निजी सहायक

चरित्र निर्माण

वीडियो निर्माण

AI प्रोजेक्ट रैंकिंग

AI प्रोजेक्ट विकास रैंकिंग

AI डेवलपर रैंकिंग

AI संगठन रैंकिंग

डीपसीक

TTS

LLM

ChatGPT

अवलोकन