Zonos-v0.1-hybrid

Zonos-v0.1-hybrid 是一款领先的开源文本转语音模型,能够提供高质量的语音合成服务。

普通产品生产力文本转语音语音合成
Zonos-v0.1-hybrid 是由 Zyphra 开发的一款开源文本转语音模型,它能够根据文本提示生成高度自然的语音。该模型经过大量英语语音数据训练,采用 eSpeak 进行文本归一化和音素化,再通过变换器或混合骨干网络预测 DAC 令牌。它支持多种语言,包括英语、日语、中文、法语和德语,并且可以对生成语音的语速、音调、音频质量和情绪等进行精细控制。此外,它还具备零样本语音克隆功能,仅需 5 到 30 秒的语音样本即可实现高保真语音克隆。该模型在 RTX 4090 上的实时因子约为 2 倍,运行速度较快。它还配备了易于使用的 gradio 界面,并且可以通过 Docker 文件简单安装和部署。目前,该模型在 Hugging Face 上提供,用户可以免费使用,但需要自行部署。
打开网站

Zonos-v0.1-hybrid 最新流量情况

月总访问量

26103677

跳出率

43.69%

平均页面访问数

5.5

平均访问时长

00:04:43

Zonos-v0.1-hybrid 访问量趋势

Zonos-v0.1-hybrid 访问地理位置分布

Zonos-v0.1-hybrid 流量来源

Zonos-v0.1-hybrid 替代品