ElevenLabs एक स्टार्टअप कंपनी है जो AI वॉयस क्लोनिंग और टेक्स्ट-टू-स्पीच API पर ध्यान केंद्रित करती है, हाल ही में उसने एक नई सुविधा की घोषणा की है जिससे उपयोगकर्ता पूर्ण संवादात्मक AI एजेंट बना सकते हैं।
उपयोगकर्ता अब ElevenLabs के डेवलपर प्लेटफ़ॉर्म पर अपनी आवश्यकताओं के अनुसार संवादात्मक एजेंट के विभिन्न वेरिएबल्स को कस्टमाइज़ कर सकते हैं, जैसे आवाज़ का स्वर और उत्तर की लंबाई।
ElevenLabs पहले विभिन्न आवाज़ और टेक्स्ट-टू-स्पीच सेवाएँ प्रदान करता था। कंपनी के ग्रोथ डायरेक्टर सैम स्कलर ने TechCrunch को बताया कि कई ग्राहक पहले से ही इस प्लेटफ़ॉर्म का उपयोग करके संवादात्मक AI एजेंट बना रहे हैं। लेकिन ज्ञानकोष का एकीकरण और ग्राहक के व्यवधान को संभालना सबसे बड़ी चुनौती थी। इसलिए, ElevenLabs ने इस प्रक्रिया को सरल बनाने के लिए एक पूर्ण संवादात्मक बॉट पाइपलाइन बनाने का निर्णय लिया।
उपयोगकर्ता ElevenLabs खाते में लॉग इन करके, टेम्पलेट चुनकर या नया प्रोजेक्ट बनाकर संवादात्मक एजेंट बनाना शुरू कर सकते हैं।वे एजेंट की मुख्य भाषा, पहला संदेश और सिस्टम संकेत चुन सकते हैं, ताकि एजेंट की व्यक्तिगतता निर्धारित की जा सके।
इसके अलावा, डेवलपर्स को बड़े भाषा मॉडल (जैसे Gemini, GPT या Claude), प्रतिक्रिया की तापमान (जो रचनात्मकता को निर्धारित करता है) और टोकन उपयोग सीमाएँ भी चुननी होती हैं।
उपयोगकर्ता अपनी आवश्यकताओं के अनुसार ज्ञानकोष जोड़ सकते हैं, जैसे फ़ाइलें, URL या टेक्स्ट ब्लॉक, ताकि संवादात्मक बॉट की क्षमताओं को बढ़ाया जा सके। साथ ही, वे अपने कस्टम बड़े भाषा मॉडल को इस बॉट के साथ एकीकृत कर सकते हैं। ElevenLabs का SDK Python, JavaScript, React और Swift के साथ संगत है, इसके अलावा, कंपनी आगे की कस्टमाइज़ेशन के लिए WebSocket API भी प्रदान करती है।
कंपनी उपयोगकर्ताओं को डेटा संग्रह मानदंड परिभाषित करने की अनुमति भी देती है, जैसे एजेंट के साथ बातचीत करने वाले ग्राहकों के नाम और ईमेल, और प्राकृतिक भाषा का उपयोग करके कॉल की सफलता या असफलता के मूल्यांकन मानदंड को परिभाषित करती है।
ElevenLabs अपने मौजूदा टेक्स्ट-टू-स्पीच पाइपलाइन का लाभ उठा रहा है, साथ ही नए संवादात्मक AI उत्पादों के लिए वॉयस-टू-टेक्स्ट कार्यक्षमता विकसित कर रहा है। वर्तमान में, कंपनी अलग से वॉयस-टू-टेक्स्ट API प्रदान नहीं करती है, लेकिन भविष्य में इसे लॉन्च कर सकती है, ताकि Google, Microsoft और Amazon जैसी कंपनियों के वॉयस-टू-टेक्स्ट API के साथ प्रतिस्पर्धा कर सके, साथ ही OpenAI के Whisper, AssemblyAI, Deepgram, Speechmatics और Gladia जैसी विशेष API के साथ भी।
कंपनी 30 अरब डॉलर से अधिक की वैल्यूएशन पर नई फंडिंग जुटाने की योजना बना रही है, और Vapi और Retell जैसी अन्य वॉयस AI स्टार्टअप कंपनियों के साथ प्रतिस्पर्धा कर रही है, जो भी संवादात्मक एजेंट बना रही हैं। सबसे महत्वपूर्ण बात यह है कि ElevenLabs OpenAI के रीयल-टाइम संवाद API के साथ प्रतिस्पर्धा करेगा। हालांकि, ElevenLabs को विश्वास है कि इसकी कस्टमाइजेशन क्षमता और मॉडल स्विचिंग की लचीलापन उसे प्रतिस्पर्धा में लाभ दिलाएगी।
मुख्य बिंदु:
💬 ElevenLabs ने संवादात्मक AI एजेंट बनाने की नई सुविधा लॉन्च की, जिससे उपयोगकर्ताओं को विभिन्न वेरिएबल्स को कस्टमाइज़ करने की अनुमति मिलती है।
📚 उपयोगकर्ता एजेंट की क्षमताओं को बढ़ाने के लिए ज्ञानकोष जोड़ सकते हैं और कस्टम बड़े भाषा मॉडल को एकीकृत कर सकते हैं।
🚀 ElevenLabs 30 अरब डॉलर से अधिक की वैल्यूएशन पर फंडिंग जुटाने की योजना बना रहा है और OpenAI जैसे प्रतिस्पर्धियों के साथ प्रतिस्पर्धा कर रहा है।