वेस्टलेक-ओम्नी मॉडल के विकास की घोषणा करते हुए, 西湖心辰 ने इसे ओपन-सोर्स करने की घोषणा की है। यह वैश्विक स्तर पर पहला ओपन-सोर्स चीनी भावनात्मक एंड-टू-एंड वॉयस इंटरएक्शन बड़ा मॉडल है, जो टेक्स्ट और वॉयस मोड को एकीकृत करने के लिए डिस्क्रीट रिप्रेजेंटेशन का उपयोग करता है, खासकर रियल-टाइम पर ध्यान केंद्रित करता है, जो तेजी से प्रतिक्रिया देने और लगभग शून्य विलंबता का अनुभव प्रदान करने में सक्षम है।
यह मॉडल उत्कृष्ट भावनात्मक समझ और अभिव्यक्ति क्षमताओं से लैस है, जो स्पष्ट, प्राकृतिक और अभिव्यक्तिपूर्ण चीनी वॉयस उत्पन्न कर सकता है। यह क्षमता उच्च गुणवत्ता वाले चीनी भावनात्मक वॉयस डेटा सेट पर गहन प्रशिक्षण का परिणाम है, जिससे मॉडल न केवल चीनी संदर्भ में जटिल भावनाओं को समझ सकता है, बल्कि इंटरएक्शन को भी अधिक मानवकृत बना सकता है।
西湖心辰 उम्मीद करता है कि वेस्टलेक-ओम्नी मॉडल को ओपन-सोर्स करके, अधिक डेवलपर्स को चीनी भावनात्मक वॉयस इंटरएक्शन तकनीक के विकास में भाग लेने के लिए प्रेरित किया जा सकेगा, ताकि इस क्षेत्र की तकनीक के विकास और अनुप्रयोग को एक साथ आगे बढ़ाया जा सके।
प्रोजेक्ट पता:https://github.com/xinchen-ai/Westlake-Omni