A empresa de inteligência artificial Cartesia lançou recentemente um modelo de conversão de voz chamado "Voice Changer". Diferente dos métodos tradicionais de conversão de voz, este modelo não apenas converte a voz de entrada para a voz de destino, mas também preserva as características expressivas da voz original, como tom e ênfase.
De acordo com a Cartesia, os usuários podem experimentar este recurso no site play.cartesia.ai. A empresa já publicou a documentação da API, que os desenvolvedores podem consultar em docs.cartesia.ai.
Observamos que esse tipo de tecnologia de conversão que preserva as características da voz é pouco comum no mercado. A maioria das ferramentas existentes costuma perder as variações de tom do falante durante a conversão, resultando em uma voz mais robótica.
A Cartesia detalha a implementação técnica em seu blog. No entanto, a empresa ainda não se manifestou sobre possíveis questões éticas, como a imitação de vozes sem autorização.