वेस्टलेक-ओम्नी मॉडल के विकास की घोषणा करते हुए, 西湖心辰 ने इसे ओपन-सोर्स करने की घोषणा की है। यह वैश्विक स्तर पर पहला ओपन-सोर्स चीनी भावनात्मक एंड-टू-एंड वॉयस इंटरएक्शन बड़ा मॉडल है, जो टेक्स्ट और वॉयस मोड को एकीकृत करने के लिए डिस्क्रीट रिप्रेजेंटेशन का उपयोग करता है, खासकर रियल-टाइम पर ध्यान केंद्रित करता है, जो तेजी से प्रतिक्रिया देने और लगभग शून्य विलंबता का अनुभव प्रदान करने में सक्षम है।

यह मॉडल उत्कृष्ट भावनात्मक समझ और अभिव्यक्ति क्षमताओं से लैस है, जो स्पष्ट, प्राकृतिक और अभिव्यक्तिपूर्ण चीनी वॉयस उत्पन्न कर सकता है। यह क्षमता उच्च गुणवत्ता वाले चीनी भावनात्मक वॉयस डेटा सेट पर गहन प्रशिक्षण का परिणाम है, जिससे मॉडल न केवल चीनी संदर्भ में जटिल भावनाओं को समझ सकता है, बल्कि इंटरएक्शन को भी अधिक मानवकृत बना सकता है।

微信截图_20240926081503.png

西湖心辰 उम्मीद करता है कि वेस्टलेक-ओम्नी मॉडल को ओपन-सोर्स करके, अधिक डेवलपर्स को चीनी भावनात्मक वॉयस इंटरएक्शन तकनीक के विकास में भाग लेने के लिए प्रेरित किया जा सकेगा, ताकि इस क्षेत्र की तकनीक के विकास और अनुप्रयोग को एक साथ आगे बढ़ाया जा सके।

प्रोजेक्ट पता:https://github.com/xinchen-ai/Westlake-Omni