A ZyphraAI lançou recentemente seu mais novo modelo de texto para fala (TTS) multilíngue, o Zonos-TTS. Este modelo é totalmente de código aberto e utilizável comercialmente, baseado na licença Apache2.0. O Zonos-TTS não apenas suporta clonagem de voz em tempo real, mas também foi treinado com 200.000 horas de dados de voz em inglês, exibindo um desempenho excepcional.
O Zonos-TTS oferece duas opções de implantação: implantação local e um serviço de API conveniente. Para usuários comuns, a ZyphraAI oferece 100 minutos de geração de áudio gratuita por mês; usuários profissionais podem optar pelo pacote de 300 minutos por US$ 5, com cobrança adicional de US$ 0,02 por minuto para uso além da cota.
Vale destacar que o recurso de clonagem de voz em tempo real é totalmente gratuito e suporta alta qualidade de áudio e controle emocional, oferecendo aos usuários grande flexibilidade e praticidade.
Além disso, o Zonos-TTS suporta a entrada de prefixos de áudio, melhorando ainda mais seus cenários de aplicação. De acordo com os testes da ZyphraAI, em uma placa de vídeo RTX4090, o modelo consegue funcionar a aproximadamente o dobro da velocidade em tempo real, demonstrando alta eficiência. Este lançamento de código aberto fornece aos desenvolvedores e empresas uma ferramenta poderosa e flexível, impulsionando o desenvolvimento da tecnologia de clonagem de voz em tempo real multilíngue.
Endereço: https://huggingface.co/Zyphra/Zonos-v0.1-hybrid