AI समाचार

वैश्विक AI नवाचार का कोई भी क्षण न चूकें

AI दैनिक

दैनिक तीन मिनट का AI उद्योग रुझान

AI समयरेखा

AI उद्योग मील के पत्थर

AI मुद्रीकरण गाइड

नवीनतम मामले

AI मुद्रीकरण मामला साझा करना

छवि संग्रह

AI छवि निर्माण मुद्रीकरण मामले

वीडियो संग्रह

AI वीडियो निर्माण मुद्रीकरण मामले

ऑडियो संग्रह

AI ऑडियो निर्माण मुद्रीकरण मामले

सामग्री संग्रह

AI सामग्री लेखन मुद्रीकरण मामले

AI ट्यूटोरियल

नवीनतम ट्यूटोरियल

नवीनतम AI ट्यूटोरियल का मुफ्त साझाकरण

AI उत्पाद रैंकिंग

AI वेबसाइटों की कुल विज़िट रैंकिंग दिखाता है

AI ट्रैफ़िक वृद्धि रैंकिंग

ट्रैफ़िक द्वारा सबसे तेज़ी से बढ़ती AI वेबसाइटों को ट्रैक करें

AI ट्रैफ़िक गिरावट रैंकिंग

महत्वपूर्ण ट्रैफ़िक गिरावट वाली AI वेबसाइटों पर ध्यान दें

AI साप्ताहिक रैंकिंग

AI वेबसाइटों की साप्ताहिक विज़िट रैंकिंग दिखाता है

AI ओपन सोर्स प्रोजेक्ट लाइब्रेरी

अवलोकन

GitHub लोकप्रिय AI ओपन सोर्स प्रोजेक्ट का अवलोकन

उत्पाद लाइब्रेरी टूल नेविगेशन

नवोन्मेषी प्रोजेक्ट EmoTalk3D 3D बोलते अवतार प्रौद्योगिकी में नवाचार लाता है, भावनाओं को नियंत्रित करने और उच्च गुणवत्ता वाली रेंडरिंग को सक्षम करता है

AIbase基地

द्वारा प्रकाशितAI समाचार · 4 मिनट पढ़ें · Aug 7, 2024

229

हाल ही में, EmoTalk3D नामक एक अत्याधुनिक तकनीकी परियोजना ने कृत्रिम बुद्धिमत्ता के क्षेत्र में व्यापक ध्यान आकर्षित किया है। इस परियोजना ने EmoTalk3D डेटा सेट को पेश करके, जिसमें कैलिब्रेटेड मल्टीव्यू वीडियो, भावनात्मक लेबल और प्रत्येक फ्रेम का 3D ज्यामिति डेटा शामिल है, उच्च फिडेलिटी पर भावनात्मक रूप से समृद्ध 3D बोलते अवतारों को स्वतंत्र रूप से बनाने में सफलता प्राप्त की है।

QQ截图20240807110705.png

जानकारी के अनुसार, EmoTalk3D परियोजना की शोध टीम ने वर्तमान 3D बोलते अवतार तकनीक में मल्टीव्यू सुसंगतता और भावनात्मक अभिव्यक्ति की कमी को ध्यान में रखते हुए एक नई संश्लेषण विधि प्रस्तुत की है। इस विधि में न केवल बेहतर होंठ सिंक्रनाइजेशन और रेंडरिंग गुणवत्ता है, बल्कि यह उत्पन्न बोलते अवतार में नियंत्रित भावनात्मक अभिव्यक्ति को भी संभव बनाती है।

शोध टीम ने "आवाज से ज्यामिति से रूप" का एक मानचित्रण ढांचा डिजाइन किया। यह ढांचा पहले ऑडियो विशेषताओं से विश्वसनीय 3D ज्यामिति अनुक्रम की भविष्यवाणी करता है, और फिर इन ज्यामितियों के आधार पर 4D गॉसियन द्वारा प्रदर्शित 3D बोलते अवतार की उपस्थिति को संश्लेषित करता है। इस प्रक्रिया में, उपस्थिति को मानक और गतिशील गॉसियन घटकों में और अधिक विभाजित किया गया है, जो मल्टीव्यू वीडियो से सीखे जाने के माध्यम से एकीकृत होते हैं, जिससे स्वतंत्र दृष्टि के बोलते अवतार एनीमेशन को रेंडर किया जा सके।

यह उल्लेखनीय है कि EmoTalk3D परियोजना की शोध टीम ने गतिशील चेहरे के विवरण जैसे कि झुर्रियों और सूक्ष्म भावनाओं को पकड़ने में पूर्व विधियों की कठिनाइयों को सफलतापूर्वक हल किया है। प्रयोगात्मक परिणाम बताते हैं कि इस विधि में उच्च फिडेलिटी और भावनात्मक रूप से नियंत्रित 3D बोलते अवतार उत्पन्न करने में महत्वपूर्ण लाभ है, जबकि होंठ आंदोलन उत्पन्न करने में बेहतर रेंडरिंग गुणवत्ता और स्थिरता प्रदर्शित होती है।

वर्तमान में, EmoTalk3D परियोजना का कोड और डेटा सेट निर्दिष्ट HTTPS URL पर प्रकाशित किया गया है, ताकि वैश्विक शोधकर्ताओं और डेवलपर्स द्वारा संदर्भित और उपयोग किया जा सके। यह नवोन्मेषी तकनीकी突破 निश्चित रूप से 3D बोलते अवतार क्षेत्र के विकास में नई ऊर्जा डालेगा, और भविष्य में वर्चुअल रियलिटी, ऑगमेंटेड रियलिटी, फिल्म निर्माण और कई अन्य क्षेत्रों में लागू होने की संभावना है।

EmoTalk3D 3D बोलते अवतार भावना अभिव्यक्ति बहु-दृष्टि वीडियो

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

एआई दैनिक: GPT-4o का नया संस्करण लॉन्च; दीवार की बुद्धिमत्ता का ओपन-सोर्स मोबाइल संस्करण 'GPT-4V'; हुआवेई ने 3D डिजिटल व्यक्ति के लिए नया ढांचा EmoTalk3D पेश किया; अलीबाबा ने ओलंपिक क्षण पोस्टर कार्यप्रवाह लॉन्च किया

【एआई दैनिक】栏目 में आपका स्वागत है! यहाँ आपके लिए हर दिन कृत्रिम बुद्धिमत्ता की दुनिया का अन्वेषण करने का मार्गदर्शक है, हम आपको हर दिन एआई क्षेत्र की गरमागरम सामग्री प्रस्तुत करते हैं, विकासकर्ताओं पर ध्यान केंद्रित करते हैं, आपको तकनीकी प्रवृत्तियों को समझने में मदद करते हैं और नए एआई उत्पादों के अनुप्रयोगों के बारे में जानकारी प्रदान करते हैं। नए एआई उत्पादों के लिए यहां क्लिक करें: https://top.aibase.com/ 1, विकासकर्ता उत्साहित! एआई की क्षमताओं में समस्या है लेकिन इसे हल किया जा सकता है, इसमें पूरा विकास स्टैक में और अधिक काम करने की आवश्यकता है, साथ ही 'दाँतेदार किनारों' का ध्यान रखना और मानव भागीदारी बनाए रखना जरूरी है।

Aug 7, 2024

910

हुआवेई और फुडान ने मिलकर EmoTalk3D नामक 3D डिजिटल मानव का नया ढांचा तैयार किया: खुशी, गम, गुस्सा और आश्चर्य की अभिव्यक्ति यथार्थवादी और समृद्ध है

3D डिजिटल मानव क्षेत्र में, नानजिंग विश्वविद्यालय, फुडान विश्वविद्यालय और हुआवेई नॉआह आर्क प्रयोगशाला के शोध टीम ने बहु-दृष्टिकोण संगति और भावनात्मक अभिव्यक्ति की कमी की समस्या के लिए नवोन्मेषी समाधान प्रस्तुत किया। उन्होंने EmoTalk3D डेटा सेट विकसित किया, जिसमें कैलिब्रेटेड बहु-दृष्टिकोण वीडियो, भावनाओं के लेबल और प्रति फ्रेम 3D ज्यामिति जानकारी शामिल है। 'आवाज़ से ज्यामिति और फिर रूप तक' मानचित्रण ढांचे का निर्माण करके, शोध टीम ने एक नए तरीके का प्रस्ताव रखा, जिससे नियंत्रित भावनाओं के साथ 3D बोलने वाले अवतार तैयार किए जा सकते हैं, जिससे होंठ समन्वय और रेंडरिंग गुणवत्ता में महत्वपूर्ण सुधार होता है। डेटा सेट के निर्माण।

Aug 7, 2024

3.6k

AI समाचार

AI दैनिक

AI समयरेखा

नवीनतम मामले

छवि संग्रह

वीडियो संग्रह

ऑडियो संग्रह

सामग्री संग्रह

नवीनतम ट्यूटोरियल

AI उत्पाद रैंकिंग

AI ट्रैफ़िक वृद्धि रैंकिंग

AI ट्रैफ़िक गिरावट रैंकिंग

AI साप्ताहिक रैंकिंग

संयुक्त राज्य अमेरिका

चीन

भारत

ब्राजील

छवि निर्माण

निजी सहायक

चरित्र निर्माण

वीडियो निर्माण

AI प्रोजेक्ट रैंकिंग

AI प्रोजेक्ट विकास रैंकिंग

AI डेवलपर रैंकिंग

AI संगठन रैंकिंग

डीपसीक

TTS

LLM

ChatGPT

अवलोकन

AIbase基地

यह लेख AIbase दैनिक से है

संबंधित AI समाचार अनुशंसाएँ