हाल ही में, Play AI ने अपने सबसे महत्वाकांक्षी उत्पाद - PlayDialog बीटा संस्करण को पेश किया है, जो संवादात्मक पॉडकास्ट ऑडियो उत्पन्न कर सकता है।

image.png

यह एंड-टू-एंड AI वॉयस मॉडल, संवाद के ऐतिहासिक संदर्भ का उपयोग करके, स्वर, भावना और गति को नियंत्रित कर सकता है, ताकि अधिक प्राकृतिक वॉयस सिंथेसिस संभव हो सके, जो मानव-यांत्रिक संवाद के नए स्तर को दर्शाता है। PlayDialog विशेष रूप से वास्तविक संवाद अनुभव बनाने के लिए उपयुक्त है, जैसे कि नैरेशन, वॉयस ओवर, सिंथेसाइज्ड पॉडकास्ट आदि, और व्यावसायिक वातावरण में इमर्सिव एक-पर-एक वॉयस संचार अनुभव प्रदान कर सकता है, जिसका प्रभाव Google के NotebookLM के समान है।

इस बीच, Play AI ने PlayNote भी लॉन्च किया है, जो एक ऐसा उपकरण है जो विभिन्न मीडिया फ़ाइलों (जैसे PDF, टेक्स्ट, वीडियो आदि) को संवाद अनुभव में बदल सकता है। उपयोगकर्ता कुछ मिनटों में पॉडकास्ट, प्रेजेंटेशन, नैरेशन, और यहां तक कि बच्चों की कहानियाँ उत्पन्न कर सकते हैं, और PlayDialog द्वारा प्रदान किए गए सहज, प्राकृतिक वॉयस प्रभाव का आनंद ले सकते हैं। PlayNote की विशेषता यह है कि यह API इंटरफेस भी प्रदान करता है, जिससे उपयोगकर्ता बिना यूजर इंटरफेस पर निर्भर हुए ऑडियो सामग्री का प्रोग्रामेटिक निर्माण आसानी से कर सकते हैं।

image.png

PlayDialog बीटा को करोड़ों वास्तविक संवादों के प्रशिक्षण के माध्यम से विकसित किया गया है, और इसका मॉडल आकार Play AI3.0mini के लगभग दस गुना है, जो स्वर (जैसे आवाज़ की लय, गति) के संदर्भ में मानव आवाज़ के प्रदर्शन से मेल खा सकता है। ब्लाइंड टेस्ट में, PlayDialog बीटा का प्रदर्शन बाजार में अग्रणी प्रतिस्पर्धी मॉडलों की तुलना में दो गुना बेहतर था, विशेष रूप से अभिव्यक्ति के मामले में सबसे उच्च स्कोर प्राप्त किया।

पिछले वॉयस मॉडलों के विपरीत, PlayDialog बीटा पूरी बातचीत के संदर्भ को समझ सकता है, जिससे वॉयस निर्माण के प्रभाव पर प्रभाव पड़ता है। Play AI ने एक नई आर्किटेक्चर बनाई है जिसे "एडाप्टिव वॉयस कॉन्टेक्स्टुअलाइज़र" (ASC) कहा जाता है, जिससे मॉडल पूर्ण संवाद इतिहास का उपयोग करके प्रतिक्रिया दे सकता है, जिससे हर वाक्य एक अलग आउटपुट नहीं होता, बल्कि उचित स्वर, भावना और टोन के साथ समृद्ध होता है, जिससे सिंथेसाइज्ड पॉडकास्ट सुनने वालों को ऐसा अनुभव कराता है जैसे वक्ता एक ही स्थान पर संवाद कर रहा हो।

चाहे वह जीवंत चर्चा हो, या सहानुभूति की आवश्यकता वाले संवेदनशील विषय, PlayDialog सहजता से अनुकूल हो सकता है, जिससे इंटरएक्शन अधिक प्राकृतिक और मानवता से भरा हुआ लगता है।

उपयोगकर्ता PlayNote के माध्यम से इन सबका अनुभव कर सकते हैं, इसे शक्तिशाली, प्राकृतिक नैरेशन, पॉडकास्ट, प्रेजेंटेशन आदि बनाने के लिए उपयोग कर सकते हैं, जो कुछ मिनटों में पूरा किया जा सकता है। PlayNote को API इंटरफेस के माध्यम से भी उपयोग किया जा सकता है, जिससे डेवलपर्स बड़े पैमाने पर प्रोग्रामेटिक तरीके से आकर्षक सामग्री उत्पन्न कर सकते हैं।

टियान एंट्री: https://play.ai/playnote

आधिकारिक ब्लॉग परिचय: https://blog.play.ai/blog/introducing-playdialog

मुख्य बिंदु:

🌟 PlayDialog बीटा Play AI द्वारा पेश किया गया एक नई पीढ़ी का वॉयस मॉडल है, जो मानव संवाद को अधिक प्राकृतिक तरीके से अनुकरण कर सकता है।

🎤 PlayNote उपकरण उपयोगकर्ताओं को विभिन्न मीडिया फ़ाइलों को ध्वनि सामग्री में तेजी से परिवर्तित करने की अनुमति देता है, और API इंटरफेस का समर्थन करता है।

🚀 PlayDialog बीटा ने ब्लाइंड टेस्ट में उत्कृष्ट प्रदर्शन किया, वॉयस निर्माण की सहजता और भावनात्मक अभिव्यक्ति दोनों को उच्च स्कोर प्राप्त किया।