Seed-TTS

高质量、多功能的语音合成模型系列

优质新品生产力语音合成文本到语音
Seed-TTS是由字节跳动推出的一系列大规模自回归文本到语音(TTS)模型,能够生成与人类语音难以区分的语音。它在语音上下文学习、说话人相似度和自然度方面表现出色,通过微调可进一步提升主观评分。Seed-TTS还提供了对情感等语音属性的优越控制能力,并能生成高度表达性和多样性的语音。此外,提出了一种自蒸馏方法用于语音分解,以及一种增强模型鲁棒性、说话人相似度和控制性的强化学习方法。还展示了Seed-TTS模型的非自回归(NAR)变体Seed-TTSDiT,它采用完全基于扩散的架构,不依赖于预先估计的音素持续时间,通过端到端处理进行语音生成。
打开网站

Seed-TTS 最新流量情况

月总访问量

10660

跳出率

60.50%

平均页面访问数

1.4

平均访问时长

00:00:46

Seed-TTS 访问量趋势

Seed-TTS 访问地理位置分布

Seed-TTS 流量来源

Seed-TTS 替代品