A Xihu Xinchen anunciou o lançamento em código aberto de seu modelo Westlake-Omni. Como o primeiro modelo de interação de voz de ponta a ponta em chinês com emoções de código aberto do mundo, o Westlake-Omni utiliza uma representação discreta para unificar os modos de texto e voz, com foco especial na capacidade de resposta em tempo real, fornecendo uma experiência com quase zero latência.

O modelo possui excelentes capacidades de compreensão e expressão emocional, capaz de gerar fala em chinês clara, natural e expressiva. Essa capacidade resulta de seu treinamento profundo em um conjunto de dados de fala em chinês com emoções de alta qualidade, permitindo que o modelo não apenas compreenda emoções complexas no contexto da língua chinesa, mas também torne a interação mais humana.

微信截图_20240926081503.png

A Xihu Xinchen espera, através do lançamento em código aberto do modelo Westlake-Omni, encorajar mais desenvolvedores a participarem do desenvolvimento de tecnologias de interação de voz com emoções em chinês, impulsionando conjuntamente o desenvolvimento e a aplicação dessa área.

Endereço do projeto:https://github.com/xinchen-ai/Westlake-Omni