A Zhihu AI anunciou que sua tecnologia de voz emocional ponta a ponta já está oficialmente disponível na plataforma Zhihu Qingyan e aberta a todos os usuários. Essa tecnologia supera as limitações das tecnologias tradicionais de conversão de texto em fala (TTS), capaz de entender profundamente o contexto e gerar diálogos naturais e emocionais. Isso marca a evolução da tecnologia de síntese de voz da Zhihu AI, de uma simples leitura de texto para uma inteligência artificial capaz de expressar emoções reais.
A tecnologia de voz emocional do Zhihu Qingyan possui várias funções avançadas. Ela não apenas entende e expressa várias emoções na fala, como alegria, raiva, tristeza e alegria, mas também suporta vários idiomas e dialetos, incluindo cantonês, dialeto do nordeste da China, inglês e japonês. Além disso, os usuários podem interromper a saída de voz a qualquer momento e ajustar livremente parâmetros como volume e velocidade. O mais impressionante é que esses recursos podem ser usados em conjunto na mesma frase, tornando a saída de voz mais vívida, rica e calorosa, como se fosse uma pessoa real.
Atualmente, a função de voz emocional já está totalmente disponível no aplicativo Zhihu Qingyan, e os usuários podem experimentar essa função imediatamente, sem necessidade de esperar. Para usar essa função, os usuários precisam apenas atualizar o aplicativo Zhihu Qingyan para a versão mais recente e clicar no botão de diálogo no canto inferior direito da caixa de diálogo para interagir com Xiaozhi e sentir seu charme único.