एडोब ने AI ध्वनि प्रभाव उत्पन्न करने वाली प्रणाली MultiFoley लॉन्च की, पाठ संकेतों के माध्यम से वीडियो समन्वयित ध्वनि प्रभाव उत्पन्न करती है

AIbase基地

द्वारा प्रकाशितAI समाचार · 6 मिनट पढ़ें · Dec 2, 2024

563

हाल ही में, Adobe अनुसंधान टीम ने मिशिगन विश्वविद्यालय के शोधकर्ताओं के साथ मिलकर एक आर्टिफिशियल इंटेलिजेंस सिस्टम विकसित किया है जिसे MultiFoley कहा जाता है, यह सिस्टम फिल्मों और वीडियो में डबिंग साउंड इफेक्ट्स उत्पन्न करने में सक्षम है, जो पोस्ट-प्रोडक्शन में मदद करता है।

MultiFoley की नवाचार यह है कि यह उपयोगकर्ताओं को टेक्स्ट प्रॉम्प्ट, संदर्भ ऑडियो या वीडियो उदाहरणों के माध्यम से साउंड इफेक्ट्स बनाने की अनुमति देता है। प्रदर्शन में, यह सिस्टम यहां तक कि बिल्ली की आवाज को शेर की दहाड़ में बदल सकता है, या टाइप राइटर की आवाज को पियानो नोट्स में परिवर्तित कर सकता है, और वीडियो दृश्यों के साथ पूरी तरह से समन्वयित कर सकता है।

MultiFoley की ऑडियो आउटपुट गुणवत्ता 48kHz के उच्च बैंडविड्थ तक पहुँचती है, जो मुख्य रूप से शोधकर्ताओं द्वारा इंटरनेट पर उपलब्ध वीडियो और पेशेवर साउंड लाइब्रेरी के साथ प्रशिक्षण के कारण है। पिछले सिस्टमों के विपरीत, MultiFoley पहली बार विभिन्न इनपुट विधियों - टेक्स्ट, ऑडियो और वीडियो संदर्भ - को एक ही मॉडल में एकीकृत करता है। यह प्रति सेकंड 8 फ्रेम के दृश्य विशेषताओं का विश्लेषण करता है, और इसे 40Hz ऑडियो सैंपलिंग दर से मेल खाने के लिए बढ़ाता है, यह सुनिश्चित करता है कि उत्पन्न ऑडियो और वीडियो के बीच निकटता से समन्वय बना रहे।

परीक्षणों में, MultiFoley ने ऑडियो और वीडियो के समन्वय और साउंड इफेक्ट्स और टेक्स्ट विवरण के मेल में उत्कृष्ट प्रदर्शन किया, औसत समन्वय सटीकता 0.8 सेकंड तक पहुँच गई, जो पारंपरिक सिस्टमों की तुलना में काफी बेहतर है, जिनमें आमतौर पर एक सेकंड से अधिक की देरी होती है। उपयोगकर्ता अनुसंधान से पता चलता है कि 85.8% प्रतिभागियों ने माना कि MultiFoley अर्थ संगति में दूसरे स्थान से बेहतर है, जबकि 94.5% प्रतिभागियों ने इसके समन्वय प्रभाव को अधिक पसंद किया।

हालांकि MultiFoley ने मजबूत संभावनाएं दिखाई हैं, लेकिन शोध टीम ने वर्तमान में कुछ सीमाओं को भी इंगित किया है, जैसे कि प्रशिक्षण डेटा का अपेक्षाकृत छोटा होना, जो इसकी साउंड इफेक्ट्स की विविधता को सीमित करता है। साथ ही, सिस्टम एक साथ कई साउंड इफेक्ट्स उत्पन्न करने में भी कुछ कठिनाइयों का सामना करता है। शोध टीम जल्द ही स्रोत कोड और मॉडल जारी करने की योजना बना रही है।

हालांकि Adobe ने अभी तक MultiFoley को अपने उत्पादों में शामिल करने की घोषणा नहीं की है, यह तकनीक Adobe Premiere Pro वीडियो संपादन सॉफ़्टवेयर में मौजूदा आर्टिफिशियल इंटेलिजेंस सुविधाओं के साथ बहुत मेल खाती है, जो व्यक्तिगत क्रिएटर्स और प्रोडक्शन कंपनियों के लिए साउंड डिज़ाइन प्रक्रिया में सुविधा लाने की उम्मीद है।

मुख्य बिंदु:
🎬 MultiFoley एक AI साउंड इफेक्ट जनरेटिंग सिस्टम है जिसे Adobe और मिशिगन विश्वविद्यालय ने मिलकर विकसित किया है, जो विभिन्न इनपुट विधियों के माध्यम से साउंड इफेक्ट्स उत्पन्न कर सकता है।
🔊 इस सिस्टम की ऑडियो आउटपुट गुणवत्ता 48kHz है, औसत समन्वय सटीकता 0.8 सेकंड है, जो पारंपरिक साउंड इफेक्ट सिस्टम से बेहतर है।
📈 उपयोगकर्ता अनुसंधान से पता चलता है कि MultiFoley साउंड इफेक्ट्स की अर्थ संगति और समन्वय प्रभाव दोनों में उच्च प्रशंसा प्राप्त करता है।

नई AI प्रणाली चिकित्सा इमेजिंग में परिवर्तनों का सटीक पता लगाती है

चिकित्सा क्षेत्र में, इमेजिंग डेटा का विश्लेषण हमेशा से ही एक जटिल और श्रमसाध्य प्रक्रिया रही है। हाल ही में, वेल कॉर्नेल मेडिकल कॉलेज के शोधकर्ताओं ने LILAC (लर्निंग-बेस्ड लॉन्गिट्यूडिनल इमेज चेंज इंफरेंस) नामक एक नई कृत्रिम बुद्धिमत्ता प्रणाली विकसित की है जो समय के साथ बदलने वाली चिकित्सा इमेजिंग का कुशलतापूर्वक और सटीक रूप से विश्लेषण और पता लगा सकती है। यह शोध 20 फरवरी को प्रोसीडिंग्स ऑफ द नेशनल एकेडमी ऑफ साइंसेज में प्रकाशित हुआ था, और LILAC की कई चिकित्सा स्थितियों में व्यापक अनुप्रयोग क्षमता को प्रदर्शित करता है। पारंपरिक चिकित्सा इमेजिंग विश्लेषण विधियों को अक्सर बड़ी मात्रा में अनुकूलन और पूर्व-

एडोब ने फायरफ़्लाई एआई वीडियो जनरेटर का सार्वजनिक बीटा संस्करण जारी किया: टेक्स्ट और इमेज को आसानी से शॉर्ट वीडियो में बदलें

एडोब ने हाल ही में घोषणा की है कि उसका नवीनतम फायरफ़्लाई एआई वीडियो जनरेटर सार्वजनिक बीटा चरण में प्रवेश कर गया है, जिससे उपयोगकर्ता टेक्स्ट और छवियों को शॉर्ट वीडियो में बदल सकें। यह नवोन्मेषी विशेषता एडोब के क्रिएटिव क्लाउड में एकीकृत है, जिससे रचनाकार अपने परिचित उपकरणों में आसानी से एआई वीडियो उत्पन्न कर सकते हैं। इस वीडियो जनरेटर की सबसे बड़ी विशेषता यह है कि यह 1080p रेजोल्यूशन, 24 फ्रेम प्रति सेकंड की गति से 5 सेकंड तक के वीडियो क्लिप उत्पन्न कर सकता है। उपयोगकर्ता एक सरल उपयोग में आसान वेब के माध्यम से इस प्रक्रिया का लाभ उठा सकते हैं।

OpenAI और सॉफ्टबैंक ने सहयोग किया,企业 AI प्रणाली "Cristal"

OpenAI और सॉफ्टबैंक ने एक रणनीतिक सहयोग की घोषणा की, जिसका उद्देश्य "Cristal" नामक एक कॉर्पोरेट कृत्रिम बुद्धिमत्ता प्रणाली लॉन्च करना है। यह प्रणाली जापान की कंपनियों को प्रक्रिया स्वचालन में मदद करने के लिए डिज़ाइन की गई है, जिससे व्यापार संचालन के मॉडल को फिर से आकार दिया जा सके। कृत्रिम बुद्धिमत्ता प्रौद्योगिकी के तीव्र विकास के साथ, अधिक से अधिक कंपनियाँ दक्षता और प्रतिस्पर्धात्मकता बढ़ाने के लिए डिजिटल परिवर्तन की तलाश कर रही हैं, और Cristal उसी का परिणाम है। चित्र स्रोत नोट्स: चित्र AI द्वारा उत्पन्न, चित्र प्राधिकरण सेवा प्रदाता Midjourney द्वारा प्रदान किया गया। Cristal प्रणाली कंपनियों के लिए।

एडोब रीडर ने एआई सहायक को पेश किया, जिससे उपयोगकर्ताओं को अनुबंध के शर्तों को समझने में आसानी होती है

दैनिक जीवन में, कई लोग अनुबंध पर हस्ताक्षर करने की आवश्यकता का सामना करते हैं, और अनुबंध की सामग्री अक्सर अस्पष्ट और कठिन होती है। उपयोगकर्ताओं को अनुबंध के शर्तों को बेहतर समझने में मदद करने के लिए, एडोब ने हाल ही में अपने रीडर सॉफ़्टवेयर में एक नई 'अनुबंध बुद्धिमान विशेषता' पेश की है। यह विशेषता एआई सहायक की सहायता से, स्वचालित रूप से फ़ाइलों और स्कैन किए गए दस्तावेज़ों में अनुबंध की सामग्री की पहचान कर सकती है और जटिल भाषा को संक्षेप में प्रस्तुत कर सकती है, जिससे उपयोगकर्ताओं के लिए समझना आसान होता है। इस फ़ीचर का परिचय एडोब के पीडीएफ प्रबंधन में एक महत्वपूर्ण कदम का प्रतीक है।

AI समाचार

AIbase基地

संबंधित AI समाचार अनुशंसाएँ

नई AI प्रणाली चिकित्सा इमेजिंग में परिवर्तनों का सटीक पता लगाती है

OpenAI और सॉफ्टबैंक ने सहयोग किया,企业 AI प्रणाली "Cristal"

एडोब रीडर ने एआई सहायक को पेश किया, जिससे उपयोगकर्ताओं को अनुबंध के शर्तों को समझने में आसानी होती है