Hume AI, जो भावनात्मक बुद्धिमत्ता वॉयस इंटरफेस पर केंद्रित एक स्टार्टअप है, ने हाल ही में "वॉयस कंट्रोल" नामक एक प्रयोगात्मक सुविधा लॉन्च की है।

यह नया उपकरण डेवलपर्स और उपयोगकर्ताओं को बिना किसी कोडिंग, एआई प्रॉम्प्ट इंजीनियरिंग या ध्वनि डिज़ाइन कौशल के व्यक्तिगत एआई आवाज़ें बनाने में मदद करने के लिए बनाया गया है। उपयोगकर्ता ध्वनि विशेषताओं को सटीक रूप से समायोजित करके अपनी आवश्यकताओं के अनुरूप ध्वनि को आसानी से अनुकूलित कर सकते हैं।

image.png

यह नई सुविधा कंपनी द्वारा पहले लॉन्च की गई "Empathic Voice Interface 2" (EVI2) पर आधारित है, जिसने आवाज़ की प्राकृतिकता, भावनात्मक प्रतिक्रिया क्षमता और अनुकूलनशीलता को बढ़ाया है। पारंपरिक आवाज़ क्लोनिंग तकनीकों के विपरीत, Hume का उत्पाद अद्वितीय और अभिव्यक्तिशील आवाज़ प्रदान करने पर केंद्रित है, जो ग्राहक सेवा चैट बॉट, डिजिटल सहायक, शिक्षकों, गाइडों और एक्सेसिबिलिटी फ़ीचर्स जैसी विभिन्न आवश्यकताओं को पूरा करता है।

वॉयस कंट्रोल फ़ीचर डेवलपर्स को आवाज़ की विशेषताओं को दस विभिन्न आयामों पर समायोजित करने की अनुमति देता है, जिसमें लिंग, दृढ़ता, उत्साह, आत्मविश्वास आदि शामिल हैं।

“पुरुष/महिला: आवाज़ का लिंग, अधिक पुरुषत्व और अधिक स्त्रीत्व के बीच का दायरा।

आत्मविश्वास: आवाज़ की दृढ़ता, संकोच और साहस के बीच।

फ्लोटेशन: आवाज़ की घनत्व, वायुमंडलीय और फ्लोटेशन के बीच।

विश्वास: आवाज़ की निश्चितता, शर्मीले और आत्मविश्वासी के बीच।

उत्साह: आवाज़ में उत्साह, शांत और उत्साह के बीच।

नासिका: आवाज़ की खुलापन, स्पष्टता और नासिका के बीच।

विश्राम: आवाज़ में तनाव, तनाव और विश्राम के बीच।

स्मूदनेस: आवाज़ की गुणवत्ता, स्मूद और कटने के बीच।

मुलायम: आवाज़ के पीछे की ऊर्जा, मुलायम और शक्तिशाली के बीच।

क्लोजनेस: आवाज़ की समावेशिता, क्लोज और हांफने के बीच।”

उपयोगकर्ता इन विशेषताओं को वर्चुअल स्लाइडर के माध्यम से रीयल-टाइम में समायोजित कर सकते हैं, जिससे अनुकूलन सरल और स्पष्ट हो जाता है। यह सुविधा वर्तमान में Hume के वर्चुअल प्लेटफॉर्म पर उपलब्ध है, उपयोगकर्ताओं को केवल मुफ्त में पंजीकरण करने की आवश्यकता है।

वॉयस कंट्रोल वर्तमान में एक परीक्षण संस्करण में लॉन्च किया गया है और Hume के Empathic Voice Interface (EVI) के साथ एकीकृत है, जिससे इसे व्यापक अनुप्रयोगों के लिए उपलब्ध कराया जा रहा है। डेवलपर्स मूल आवाज़ का चयन कर सकते हैं, उसकी विशेषताओं को समायोजित कर सकते हैं, और रीयल-टाइम में परिणामों का पूर्वावलोकन कर सकते हैं। यह प्रक्रिया ग्राहक सेवा बॉट या वर्चुअल सहायक जैसे रीयल-टाइम अनुप्रयोगों के लिए महत्वपूर्ण कार्यक्षमता की सुसंगतता और स्थिरता सुनिश्चित करती है।

EVI2 का प्रभाव वॉयस कंट्रोल फ़ीचर पर स्पष्ट है। प्रारंभिक मॉडलों ने संवाद प्रॉम्प्ट और बहुभाषी सुविधाओं जैसे कार्यों को पेश किया, जो वॉयस एआई अनुप्रयोगों के दायरे को विस्तारित करते हैं। उदाहरण के लिए, EVI2 उप-सेकंड प्रतिक्रिया समय का समर्थन करता है, जो प्राकृतिक, तात्कालिक संवाद को सक्षम करता है। यह इंटरएक्टिव प्रक्रिया के दौरान बोलने की शैली को गतिशील रूप से समायोजित करने की अनुमति देता है, जिससे यह व्यवसायों के लिए एक बहुउपयोगी उपकरण बनता है।

यह कदम एआई उद्योग में पूर्वनिर्धारित आवाज़ों पर निर्भरता की समस्या को हल करने के लिए उठाया गया है, क्योंकि कई ब्रांड या अनुप्रयोग अक्सर अपनी आवश्यकताओं को पूरा करने वाली आवाज़ें ढूंढने में कठिनाई का सामना करते हैं। Hume का लक्ष्य भावनात्मक रूप से संवेदनशील वॉयस एआई विकसित करना और उद्योग में प्रगति को बढ़ावा देना है। EVI2 के लॉन्च के समय, सितंबर 2024 में, इसने आवाज़ की देरी और लागत प्रभावशीलता को काफी बढ़ा दिया और वॉयस ट्यूनिंग फ़ीचर के लिए एक सुरक्षित विकल्प प्रदान किया।

Hume की शोध-प्रेरित विधि उत्पाद विकास में केंद्रीय भूमिका निभाती है, जिसमें क्रॉस-कल्चरल आवाज़ रिकॉर्डिंग और भावनात्मक सर्वेक्षण डेटा का संयोजन होता है। यह पद्धति EVI2 और नए लॉन्च किए गए वॉयस कंट्रोल का आधार बनाती है, जिससे यह मानव ध्वनि की धारणा को बारीकी से पकड़ने में सक्षम होती है।

वर्तमान में, वॉयस कंट्रोल परीक्षण संस्करण में लॉन्च किया गया है और Hume के Empathic Voice Interface (EVI) के साथ मिलकर विभिन्न अनुप्रयोग परिदृश्यों का समर्थन करता है। डेवलपर्स मूल आवाज़ का चयन कर सकते हैं, उसकी विशेषताओं को समायोजित कर सकते हैं, और रीयल-टाइम में परिणामों का पूर्वावलोकन कर सकते हैं, यह सुनिश्चित करते हुए कि ग्राहक सेवा या वर्चुअल सहायक जैसे रीयल-टाइम अनुप्रयोगों में स्थिरता और स्थिरता बनी रहे।

बाजार में प्रतिस्पर्धा बढ़ने के साथ, Hume की व्यक्तिगत आवाज़ और भावनात्मक बुद्धिमत्ता की स्थिति इसे वॉयस एआई क्षेत्र में अलग बनाती है। भविष्य में, Hume वॉयस कंट्रोल की सुविधाओं का विस्तार करने, समायोज्य आयामों को जोड़ने, ध्वनि गुणवत्ता को अनुकूलित करने और मूल आवाज़ों की चयन रेंज को बढ़ाने की योजना बना रहा है।

आधिकारिक ब्लॉग: https://www.hume.ai/blog/introducing-voice-control

मुख्य बिंदु:  

🔊 **Hume AI ने "वॉयस कंट्रोल" फ़ीचर लॉन्च किया है, उपयोगकर्ता आसानी से व्यक्तिगत एआई आवाज़ें बना सकते हैं।**  

🛠️ **यह फ़ीचर कोडिंग कौशल की आवश्यकता नहीं है, उपयोगकर्ता स्लाइडर के माध्यम से आवाज़ की विशेषताओं को समायोजित कर सकते हैं।**  

🌐 **Hume का उद्देश्य व्यक्तिगत और भावनात्मक बुद्धिमत्ता वाले वॉयस एआई के माध्यम से विविध अनुप्रयोग आवश्यकताओं को पूरा करना है।**