Zonos-v0.1-híbrido
Zonos-v0.1-híbrido é um modelo de texto para fala (TTS) de código aberto líder, capaz de fornecer serviços de síntese de voz de alta qualidade.
Produto ComumProdutividadeTexto para falaSíntese de voz
Zonos-v0.1-híbrido é um modelo de texto para fala de código aberto desenvolvido pela Zyphra. Ele gera fala altamente natural a partir de prompts de texto. O modelo foi treinado em um grande conjunto de dados de fala em inglês, usando eSpeak para normalização e fonemização de texto, seguido pela previsão de tokens DAC por meio de uma rede Transformer ou backbone híbrida. Ele suporta vários idiomas, incluindo inglês, japonês, chinês, francês e alemão, e permite controle refinado sobre a velocidade, tom, qualidade de áudio e emoção da fala gerada. Além disso, ele possui funcionalidade de clonagem de voz de amostra zero, requerendo apenas 5 a 30 segundos de amostra de voz para clonagem de voz de alta fidelidade. O modelo tem um fator de tempo real de aproximadamente 2x em uma RTX 4090, oferecendo operação rápida. Ele também inclui uma interface gradio fácil de usar e pode ser facilmente instalado e implantado por meio de um arquivo Docker. Atualmente, o modelo está disponível no Hugging Face e pode ser usado gratuitamente, mas requer implantação independente.
Zonos-v0.1-híbrido Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44