डिजिटल इंसान का आगाज़! बाइट्स का Loopy का मुख मिलान फ़ंक्शन अब जिम्ब्र में लाइव, संदर्भ के अनुसार भावनाएँ और इमोशन्स को मिलाकर

AIbase基地

द्वारा प्रकाशितAI समाचार · 7 मिनट पढ़ें · Sep 23, 2024

2.2k

क्या आपको याद है कि महीने की शुरुआत में जब नए प्रोजेक्ट Loopy का विमोचन हुआ था, तो सभी लोग कितने हैरान थे? यह प्रोजेक्ट जो डिजिटल इंसान की आवाज़ को चित्र और भावनाओं के साथ पूरी तरह से मेल खाता है, अब आधिकारिक तौर पर जिमेंग पर लाइव हो गया है।

AIbase ने इसका अनुभव किया, और परिणाम बहुत अच्छा था, इसे वर्तमान में चीनी भाषा के लिए सबसे अच्छे लिप-सिंक सेवाओं में से एक कहा जा सकता है।

पहले, लिप-सिंक वीडियो में एक सामान्य समस्या होती थी, जो यह थी कि मुंह के हिलने से ऐसा लगता था कि आवाज़ उसी से नहीं निकल रही है, जिससे दर्शकों को एक अलगाव का अनुभव होता था।

बाइटडांस और झेजियांग विश्वविद्यालय की अनुसंधान टीम द्वारा विकसित ऑडियो-ड्रिवन वीडियो डिफ्यूजन मॉडल LOOPY ने इस समस्या का पूरी तरह से समाधान किया है।

पिछले लिप-सिंक तकनीकों से भिन्न, Loopy लिप-सिंक वीडियो में पात्रों को बात करते या गाते समय स्वचालित रूप से उस संदर्भ में उपयुक्त स्वर, भावना और अभिव्यक्ति भी जोड़ता है। यह वर्चुअल इमेज के हर छोटे-छोटे आंदोलनों को सटीक रूप से "निर्देशित" कर सकता है, जैसे कि आह भरना, भावनात्मक रूप से भौंहें और आंखों की हरकतें, और स्वाभाविक सिर की हरकतें।

वर्तमान में, यह सुविधा बाइटडांस के जिमेंग वीडियो जनरेशन मॉड्यूल में शामिल की गई है:

AIbase ने एक लड़की की फोटो अपलोड की और परीक्षण किया,

जिमेंग में लिप-सिंक के लिए वर्तमान में दो तरीके उपलब्ध हैं:

1. टेक्स्ट रीडिंग

文本朗读.jpg

जिमेंग का संचालन काफी सरल है, आपको केवल उस पात्र की तस्वीर या वीडियो अपलोड करनी होती है जिसे आप लिप-सिंक करना चाहते हैं, फिर टेक्स्ट दर्ज करें और एक वॉयसओवर चुनें। यहाँ AIbase ने एक ठंडी और आकर्षक आवाज़ चुनी है, परिणाम इस प्रकार है:

आप देख सकते हैं, पात्र बोलते समय कुछ सूक्ष्म भावनाएं भी दिखा रहा है, और बोलने के दौरान, चेहरे की रेखाएँ और अन्य विवरण भी बहुत वास्तविक हैं।

2. स्थानीय वॉयसओवर अपलोड करें

और, आप केवल उसे बात करने के लिए नहीं कह सकते, बल्कि आप एक गाने का ऑडियो भी अपलोड कर सकते हैं और उसे गाने के लिए कह सकते हैं:

对口型，图片+本地配音.jpg

यहाँ AIbase ने हाल ही में लोकप्रिय एक TikTok क्लिप का चयन किया है, आइए परिणाम देखें:

परिणाम वास्तव में अच्छा है, न केवल लिप-सिंक सही है, बल्कि आवाज़ भी किसी प्रकार के अलगाव का अनुभव नहीं कराती, ऐसा लगता है जैसे लड़की की असली आवाज़ यही है।

हालांकि एक छोटी समस्या है, AIbase द्वारा चुनी गई इस लड़की की तस्वीर में, उसकी आँखें दर्शकों की ओर नहीं देख रही हैं, शायद इससे पहचान की भावना उतनी मजबूत नहीं है, मैं एक और फ्रंटल तस्वीर का प्रयास करता हूँ:

क्या यह बेहतर नहीं है, और पात्र गाते समय भी आंखें बंद करने, सिर हिलाने जैसे बहुत वास्तविक क्रियाएँ कर रहा है।

AIbase ने एक पुरुष संस्करण का भी परीक्षण किया, परिणाम इस प्रकार है:

क्या परिणाम अद्भुत नहीं है? AIbase को यह देखकर बहुत खुशी हुई कि लिप-सिंक करते समय, यह Adam's apple, भौंहें और अन्य सूक्ष्म बदलावों पर भी ध्यान देता है। जिससे समग्र वीडियो और अधिक वास्तविक बनता है।

जो लोग रुचि रखते हैं वे स्वयं अनुभव कर सकते हैं~

जिमेंग उत्पाद का लिंक: https://top.aibase.com/tool/jimeng

Loopy मुख मिलान बाइट्स जंपिंग AIbase

यह लेख AIbase दैनिक से है

【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।

—— AIbase दैनिक समूह द्वारा बनाया गया

शॉर्ट वीडियो से कॉपी पेमेंट के लिए परेशान हैं? बीनबैग वेब वर्ज़न से एक क्लिक में ही टिकटॉक वीडियो से कॉपी तैयार करें!

कई सोशल मीडिया करने वाले दोस्तों को वीडियो कॉपी निकालने की ज़रूरत होती है, लेकिन अच्छे रिजल्ट वाले आमतौर पर पेड होते हैं, और उनकी कीमत भी कम नहीं होती। कुछ टूल्स मासिक सब्सक्रिप्शन पर चलते हैं, जिनकी कीमत कुछ दस रुपये से लेकर सौ रुपये से ज़्यादा तक होती है; और कुछ कॉपी निकालने की संख्या के हिसाब से चार्ज करते हैं, जो धीरे-धीरे बड़ा खर्चा बन जाता है। नतीजा, मुझे पता चला कि बीनबैग वेब वर्ज़न से कॉपी मुफ़्त में निकाली जा सकती है। बस बीनबैग वेब वर्ज़न में टिकटॉक वीडियो लिंक डालें, एक्सट्रैक्ट पर क्लिक करें, और कुछ ही सेकंड में पूरी वीडियो कॉपी तैयार हो जाएगी, और वो भी बहुत सही सटीकता के साथ। मिसाल के तौर पर, मैंने AIbase द्वारा पहले पोस्ट किया गया एक वीडियो डाला...

Mar 24, 2025

बाइट्स का ओपन-सोर्स मुँह के आकार की समन्वय मॉडल LatentSync, अत्यधिक वास्तविक मुँह के आकार का समन्वय लागू करना

हाल ही में, बाइट्स जंपिंग ने LatentSync नामक एक नए मुँह के आकार के समन्वय ढाँचे को लॉन्च किया है, जिसका उद्देश्य ऑडियो शर्तित संभावित प्रसार मॉडल का उपयोग करके अधिक सटीक मुँह के आकार का समन्वय प्राप्त करना है। यह ढाँचा Stable Diffusion पर आधारित है और समय की स्थिरता के लिए ऑप्टिमाइज़ किया गया है। पहले के पिक्सेल स्पेस प्रसार या दो-चरणीय जनरेशन विधियों की तुलना में, LatentSync एक एंड-टू-एंड दृष्टिकोण अपनाता है, जिसमें मध्यवर्ती गति प्रतिनिधित्व की आवश्यकता नहीं होती है, और यह सीधे ऑडियो और दृश्य के बीच जटिल संबंधों का मॉडलिंग कर सकता है। LatentSync के भीतर

Jan 6, 2025

5.1k

दौ बाओ बड़े मॉडल टीम ने आधिकारिक रूप से छवि संपादन मॉडल SeedEdit की घोषणा की, मुँह से पी चित्र सच हो गया!

भाइयों, एक वाक्य में पी चित्र सच हो गया! क्या आपको पहले MJ द्वारा पेश किए गए छवि संपादन फ़ीचर की याद है? आप जिस क्षेत्र को संशोधित करना चाहते हैं, उसे रंगकर, संकेत शब्द दर्ज करें और मूल चित्र को एक क्लिक से बदलें। अब, दौ बाओ बड़े मॉडल टीम ने भी इसी तरह की फ़ीचर—SeedEdit—को आधिकारिक रूप से ऑनलाइन किया है। और, MJ की तुलना में, जिसमें किसी तत्व को संपादित करने के लिए क्षेत्र को रंगने की आवश्यकता पड़ती है, SeedEdit और भी सरल और तेज़ है। आपको क्षेत्र को रंगने की ज़रूरत नहीं है, आपको केवल AI को एक वाक्य आदेश देना होगा, और यह आपके द्वारा संशोधित किए जाने वाले स्थान को सटीक रूप से बदल देगा। उदाहरण के लिए, AIbase एक कूल फोटो अपलोड करें।

Nov 11, 2024

7.0k

बाइट्स ने एकल छवि वीडियो संचालित मॉडल X-Portrait 2 का अनावरण किया, किफायती और प्रभावशाली पोर्ट्रेट एनीमेशन तकनीक

हाल ही में, बाइट्स जंपिंग ने नवीनतम पोर्ट्रेट एनीमेशन तकनीक X-Portrait2 पेश की, जिसका लक्ष्य अत्यधिक कम लागत और प्रभावी तरीके से जीवंत और यथार्थवादी किरदार एनीमेशन बनाना है। उपयोगकर्ताओं को केवल एक स्थिर पोर्ट्रेट छवि और प्रदर्शन संचालित वीडियो प्रदान करने की आवश्यकता होती है, X-Portrait2 वीडियो में भावनाओं को पोर्ट्रेट में स्थानांतरित कर एनीमेशन वीडियो उत्पन्न कर सकता है, इस प्रकार पारंपरिक मोशन कैप्चर और किरदार एनीमेशन की जटिल प्रक्रिया को सरल बनाता है। इस तकनीक का核心 इसके उन्नत भावनाओं एन्कोडर मॉडल में है, जो विशाल डेटा सेटों के प्रशिक्षण के माध्यम से विकसित किया गया है और इनपुट को अंतर्निहित रूप से एन्कोड करने में सक्षम है।

Nov 7, 2024

5.7k

AI फैशन डिज़ाइन में क्रांति लाएगा! FLUX.1-dev LoRA कपड़ा जनरेटर आ गया, जिसमें डिजाइनिंग में नए लोगों के लिए भी त्वरित कपड़ा प्रभाव चित्र बनाने की सुविधा है

TryOn Labs द्वारा विकसित FLUX.1-dev LoRA कपड़ा जनरेटर, उन्नत कृत्रिम बुद्धिमत्ता तकनीक का उपयोग करके उपयोगकर्ताओं को अविस्मरणीय फैशन डिज़ाइन अनुभव प्रदान करता है। केवल कपड़े के रंग, पैटर्न, सामग्री, शैली आदि जैसे विवरणों का पाठ के माध्यम से इनपुट करें, और त्वरित रूप से संबंधित कपड़ा डिज़ाइन चित्र उत्पन्न करें। FLUX.1-dev LoRA मॉडल की ताकत इसकी लचीली इनपुट प्रारूप और समृद्ध फैशन ज्ञान आधार में निहित है। उपयोगकर्ता अपनी रचनात्मकता को पूरी तरह से व्यक्त कर सकते हैं, अपने आदर्श कपड़े का वर्णन कर सकते हैं।

Nov 7, 2024

7.8k

AI दैनिक: पब्लिक अकाउंट ने腾讯元器 AI बुद्धिमान एजेंट को जोड़ा; बाइट्स Loopy की लिप-सिंक फ़ीचर जल्द ही上线; PixVerse की नई UI जारी; अली क्लाउड मोडिंग समुदाय ने AIGC क्षेत्र शुरू किया

हमारे【AI दैनिक】栏目 में आपका स्वागत है! यहाँ आपके लिए हर दिन आर्टिफिशियल इंटेलिजेंस की दुनिया का अन्वेषण करने का मार्गदर्शन है, हर दिन हम आपको AI क्षेत्र की गर्म विषयों पेश करते हैं, डेवलपर पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में, नवाचार AI उत्पादों के अनुप्रयोगों को जानने में मदद करते हैं। नए AI उत्पादों के बारे में जानने के लिए क्लिक करें: https://top.aibase.com/1, डिजिटल मानव उड़ान भर रहा है! भविष्य में AI प्रदर्शन का प्रभावी मूल्यांकन करना एक महत्वपूर्ण चुनौती बन जाएगा।

Sep 23, 2024

1.1k

अविनाशी काटने का उपकरण! ऑब्जेक्ट कटर के साथ आपको केवल एक शब्द टाइप करने की आवश्यकता है ताकि विशिष्ट वस्तु को काटा जा सके

ऑब्जेक्ट कटर एक स्मार्ट इमेज प्रोसेसिंग टूल है जो टेक्स्ट कमांड और इमेज पहचान तकनीक के संयोजन का उपयोग करता है, ताकि काटने की प्रक्रिया को सरल बनाया जा सके। उपयोगकर्ता केवल टेक्स्ट विवरण या चयनात्मक क्रिया द्वारा उसे बनाए रखने के लिए आवश्यक चित्र तत्वों को निर्दिष्ट करते हैं, और सिस्टम स्वचालित रूप से लक्ष्य वस्तु की पहचान और निकासी करता है, जबकि पृष्ठभूमि की सामग्री को हटा देता है। इसका मुख्य आकर्षण जटिल दृश्यों को सटीकता से संभालने की क्षमता है, जैसे मल्टी-ऑब्जेक्ट वातावरण में एकल वस्तु का काटना, और उपयोगकर्ता को पेशेवर इमेज संपादन कौशल की आवश्यकता नहीं है। यह उपकरण एक ऑनलाइन प्लेटफ़ॉर्म के माध्यम से सेवा प्रदान करता है, उपयोगकर्ताओं को चित्र अपलोड करने और पाठ निर्देशों के अनुसार कार्य करने की अनुमति देता है।

Sep 12, 2024

6.4k

ध्वनि सुनने में असली! बाइट का नया प्रोजेक्ट Loopy डिजिटल मानव की आवाज़ को दृश्य से सही ढंग से मिलाने में सफल

LOOPY तकनीक, जो बाइटडांस और झेजियांग विश्वविद्यालय द्वारा संयुक्त रूप से विकसित की गई है, एक ऑडियो-ड्रिवन वीडियो डिफ्यूजन मॉडल है, जिसका उद्देश्य वर्चुअल इमेज को जनरेट करते समय आवाज़ और दृश्य में बंटवारे की समस्या को हल करना है। यह तकनीक केवल एक इमेज फ़्रेम और ऑडियो इनपुट की जरूरत होती है, जिससे यह वास्तविक, गतिशील और ऑडियो की गति और भावनाओं के अनुरूप वर्चुअल इमेज के कार्य उत्पन्न कर सकती है, जिसमें गैर-वाचिक कार्य, भावनात्मक रूप से संचालित भौंह और आंखों की गतिविधि और स्वाभाविक सिर की गति शामिल है। LOOPY की खासियत उसका अनूठा दीर्घकालिक गति सूचना पकड़ने वाला मॉड्यूल है, जो विभिन्न दृश्य और ध्वनि शैलियों का समर्थन करता है, वर्चुअल इमेज के गतिशील प्रभाव के लिए।

Sep 5, 2024

38.4k

एक बटन से हाई-स्वीट कार्टून चेहरे में बदलें! कुछ लोग AI का उपयोग करके 3D कार्टून प्रोफाइल के लिए एक वीडियो से 1000+ कमाते हैं।

यह लेख एक AI टूल का उपयोग करके असली फोटो को प्यारे 3D कार्टून स्टाइल इमेज में बदलने के तरीके को साझा करता है। वीडियो शूट करने की आवश्यकता नहीं है, बस एक फोटो की मदद से कई स्टाइल की 3D कार्टून इमेज जनरेट की जा सकती हैं। लेख में प्रक्रिया के चरण प्रदान किए गए हैं, जिसमें AIbase के जिमेंग आधिकारिक वेबसाइट पर जाना, मॉडल चुनना, फोटो आयात करना, कीवर्ड सेट करना आदि शामिल हैं, विभिन्न स्टाइल के 3D कार्टून प्रोफाइल बनाने के लिए। इसके अलावा, लेख में सामग्री तैयारी, जनरेशन टूल के उपयोग की विधि और कीवर्ड के माध्यम से जनरेट की गई इमेज के स्टाइल को समायोजित करने के तरीके को भी साझा किया गया है, जैसे कि प्लश स्टाइल, हैंड-ड्रॉयन स्टाइल इत्यादि। अंत में

Aug 30, 2024

3.1k

जब मैंने काला देवता वुकोंग के लिए एक-क्लिक कपड़ा बदलने के लिए कोलॉर्स वर्चुअल ट्राई-ऑन का प्रयास किया, तो वह दृश्य...

इस लेख में कोलॉर्स द्वारा लॉन्च किए गए एक-क्लिक कपड़ा बदलने के उपकरण कोलॉर्स वर्चुअल ट्राई-ऑन का परिचय दिया गया है, जो उपयोगकर्ताओं को व्यक्ति की तस्वीर और कपड़ों की तस्वीर अपलोड करने की अनुमति देता है और परिवर्तित कपड़ों का प्रभाव देता है। संचालन सरल है, प्रभाव अच्छा है, सीधे प्लेटफ़ॉर्म द्वारा प्रदान किए गए कपड़ों का उपयोग करने का समर्थन करता है, और उपयोगकर्ताओं को अपनी कपड़ों की तस्वीरें अपलोड करने की भी अनुमति देता है, यहां तक कि AI द्वारा कपड़े बनवाने की भी अनुमति है। लेख में परीक्षण के परिणाम और सुझाव दिए गए हैं, जैसे कि बेहतर कपड़ा परिवर्तन प्रभाव को प्राप्त करने के लिए सफेद पृष्ठभूमि वाले कपड़े की तस्वीरें और सामने के बिना पृष्ठभूमि की मॉडल तस्वीरें चुनना। अंत में, लेख में अनुप्रयोग की सोच प्रस्तुत की गई है।

Aug 27, 2024

4.5k

AI समाचार

AI दैनिक

AI समयरेखा

अल हार्डवेयर

नवीनतम मामले

छवि संग्रह

वीडियो संग्रह

ऑडियो संग्रह

सामग्री संग्रह

नवीनतम ट्यूटोरियल

AI उत्पाद रैंकिंग

AI ट्रैफ़िक वृद्धि रैंकिंग

AI ट्रैफ़िक गिरावट रैंकिंग

AI साप्ताहिक रैंकिंग

संयुक्त राज्य अमेरिका

चीन

भारत

ब्राजील

छवि निर्माण

निजी सहायक

चरित्र निर्माण

वीडियो निर्माण

AI प्रोजेक्ट रैंकिंग

AI प्रोजेक्ट विकास रैंकिंग

AI डेवलपर रैंकिंग

AI संगठन रैंकिंग

डीपसीक

TTS

LLM

ChatGPT

अवलोकन