ElevenLabs ने हाल ही में अपने नवीनतम मानव आवाज सिंथेसिस मॉडल Flash को आधिकारिक रूप से लॉन्च किया है, जिसमें दावा किया गया है कि यह अब तक का सबसे तेज़ टेक्स्ट-टू-स्पीच (TTS) समाधान है, जो केवल 75 मिलीसेकंड (एप्लिकेशन और नेटवर्क देरी के अलावा) में आवाज उत्पन्न करता है। Flash विशेष रूप से कम देरी वाले संवादात्मक वॉयस असिस्टेंट के लिए उपयुक्त है, और उपयोगकर्ता ElevenLabs के संवाद AI प्लेटफॉर्म पर इस नई सुविधा का तुरंत अनुभव कर सकते हैं।

image.png

Flash मॉडल के दो संस्करण हैं, जिसमें Flash v2 केवल अंग्रेजी का समर्थन करता है, जबकि Flash v2.5 32 भाषाओं का समर्थन करता है। इन दोनों मॉडलों का उपयोग करते समय, उपयोगकर्ता हर दो वर्ण उत्पन्न करने पर 1 अंक बिंदु का उपयोग करेंगे। हालांकि Flash मॉडल की आवाज की गुणवत्ता और भावनात्मक गहराई Turbo मॉडल की तुलना में थोड़ी कम है, लेकिन इसकी कम देरी की विशेषता ने इसे ब्लाइंड टेस्ट में अन्य प्रतिस्पर्धियों से आगे बढ़ा दिया, जिससे यह समान मॉडलों में सबसे तेज़ विकल्प बन गया।

ElevenLabs की तकनीकी टीम का कहना है कि Flash मॉडल का लॉन्च मानव-यांत्रिक इंटरैक्शन की प्रवाहिता और प्राकृतिकता को बढ़ावा देगा। डेवलपर्स सीधे API के माध्यम से मॉडल ID "eleven_flash_v2" और "eleven_flash_v2_5" का उपयोग कर सकते हैं, विस्तृत API संदर्भ सामग्री ElevenLabs की वेबसाइट पर उपलब्ध है। इस नवाचार के माध्यम से, ElevenLabs अधिक कम देरी वाले, मानव-संबंधित संवाद इंटरैक्शन परिदृश्यों को खोलने की उम्मीद कर रहा है।

image.png

ElevenLabs कई उत्पादों और समाधानों की पेशकश करता है, जिसमें कस्टम वॉयस असिस्टेंट, ऑडियो प्रोडक्शन टूल्स और वॉयसओवर स्टूडियोज शामिल हैं, जिसका उद्देश्य विभिन्न क्षेत्रों के उपयोगकर्ताओं और डेवलपर्स को उच्च गुणवत्ता वाली AI ऑडियो निर्माण में मदद करना है। इसके अलावा, ElevenLabs सक्रिय रूप से अनुसंधान और विकास में लगा हुआ है, ताकि इसके उत्पादों की तकनीकी स्तर को निरंतर बढ़ाया जा सके और उपयोगकर्ताओं की बढ़ती मांग को पूरा किया जा सके।

मुख्य बिंदु:

🌟 Flash मॉडल द्वारा उत्पन्न आवाज की देरी केवल 75 मिलीसेकंड है, जो कम देरी वाले संवादात्मक वॉयस असिस्टेंट के लिए उपयुक्त है।

🌍 Flash v2.5 32 भाषाओं का समर्थन करता है, उपयोगकर्ता हर दो वर्ण उत्पन्न करने पर 1 अंक का उपयोग करते हैं।

🚀 ब्लाइंड टेस्ट में, Flash मॉडल ने अन्य समान उत्पादों को पीछे छोड़ दिया, जिससे यह सबसे तेज टेक्स्ट-टू-स्पीच समाधान बन गया।