西湖心辰宣布开源其研发的Westlake-Omni模型。作为全球首个开源的中文情感端到端语音交互大模型,Westlake-Omni采用了离散表示法来统一文本和语音模态,特别注重实时性,能够快速响应并提供几乎零延迟的体验。

该模型具备出色的情感理解与表达能力,能够生成清晰、自然、富有表现力的中文语音。这种能力得益于其在高质量中文情感语音数据集上的深度训练,使得模型不仅能够理解中文语境下的复杂情感,还能使交互更加人性化。

微信截图_20240926081503.png

西湖心辰期望通过开源Westlake-Omni模型,鼓励更多开发者参与到中文情感语音交互技术的开发中,共同推动该领域技术的发展和应用。

项目地址:https://github.com/xinchen-ai/Westlake-Omni