BASE TTS
亚马逊的大规模语音合成模型
普通产品其他语音合成自然语言处理
BASE TTS是亚马逊开发的大规模文本到语音合成模型,运用了10亿参数的自动回归转换器,可将文本转换成语音代码,再通过卷积解码器生成语音波形。该模型使用了超过10万小时的公共语音数据进行训练,实现了语音自然度的新状态。还具有音素解离和压缩等新颖的语音编码技术。随着模型规模的增大,BASE TTS展现出了处理复杂句子的自然语调能力。
BASE TTS 最新流量情况
月总访问量
331508
跳出率
59.48%
平均页面访问数
2.1
平均访问时长
00:01:02