西湖心辰は、開発したWestlake-Omniモデルのオープンソース化を発表しました。世界初のオープンソースの中国語感情エンドツーエンド音声対話大規模モデルであるWestlake-Omniは、離散表現法を用いてテキストと音声のモダリティを統一し、リアルタイム性を重視することで、迅速な応答とほぼゼロ遅延の体験を提供します。
このモデルは、優れた感情理解と表現能力を備え、クリアで自然で表現力豊かな中国語の音声を生成できます。この能力は、高品質な中国語感情音声データセットでの深層学習によるもので、中国語の文脈における複雑な感情を理解するだけでなく、より人間味のあるインタラクションを可能にします。
西湖心辰は、Westlake-Omniモデルのオープンソース化を通じて、より多くの開発者が中国語感情音声対話技術の開発に参加し、この分野の技術発展と応用を共に推進することを期待しています。
プロジェクトアドレス:https://github.com/xinchen-ai/Westlake-Omni