SpeechGPT2

全端到端的类人语音对话模型

优质新品聊天语音对话情感表达
SpeechGPT2是由复旦大学计算机科学学院开发的端到端语音对话语言模型,能够感知并表达情感,并根据上下文和人类指令以多种风格提供合适的语音响应。该模型采用超低比特率语音编解码器(750bps),模拟语义和声学信息,并通过多输入多输出语言模型(MIMO-LM)进行初始化。目前,SpeechGPT2还是一个基于轮次的对话系统,正在开发全双工实时版本,并已取得一些有希望的进展。尽管受限于计算和数据资源,SpeechGPT2在语音理解的噪声鲁棒性和语音生成的音质稳定性方面仍有不足,计划未来开源技术报告、代码和模型权重。
打开网站

SpeechGPT2 最新流量情况

月总访问量

2099

跳出率

59.14%

平均页面访问数

1.0

平均访问时长

00:00:00

SpeechGPT2 访问量趋势

SpeechGPT2 访问地理位置分布

SpeechGPT2 流量来源