स्पीचGPT2
पूर्णतः अंत-से-अंत मानव-सदृश ध्वनि वार्तालाप मॉडल
प्रीमियम नया उत्पादचैटिंगध्वनि वार्तालापभावना अभिव्यक्ति
स्पीचGPT2 फुदान विश्वविद्यालय के कंप्यूटर विज्ञान संकाय द्वारा विकसित एक अंत-से-अंत ध्वनि वार्तालाप भाषा मॉडल है जो भावनाओं को समझ सकता है और व्यक्त कर सकता है, और संदर्भ और मानव निर्देशों के अनुसार कई शैलियों में उपयुक्त ध्वनि प्रतिक्रिया प्रदान कर सकता है। यह मॉडल एक अति-निम्न बिट दर ध्वनि एन्कोडिंग-डिकोडिंग कोडेक (750bps) का उपयोग करता है, जो सिमेंटिक और ध्वनिक जानकारी का अनुकरण करता है, और बहु-इनपुट बहु-आउटपुट भाषा मॉडल (MIMO-LM) के माध्यम से इनिशियलाइज़ किया जाता है। वर्तमान में, स्पीचGPT2 अभी भी एक राउंड-आधारित वार्तालाप प्रणाली है, फुल-डुप्लेक्स रीयल-टाइम संस्करण विकसित किया जा रहा है, और कुछ आशाजनक प्रगति हुई है। हालांकि कम्प्यूटेशनल और डेटा संसाधनों की सीमा के कारण, स्पीचGPT2 में ध्वनि समझ की शोर प्रतिरोधक क्षमता और ध्वनि उत्पन्न करने की ध्वनि गुणवत्ता स्थिरता में अभी भी कमी है, भविष्य में ओपन-सोर्स तकनीकी रिपोर्ट, कोड और मॉडल वेट जारी करने की योजना है।
स्पीचGPT2 नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
536
बाउंस दर
37.61%
प्रति विज़िट औसत पृष्ठ
1.9
औसत विज़िट अवधि
00:00:31