Sesame CSM
一个用于生成对话式语音的模型,支持从文本和音频输入生成高质量的语音。
优质新品生产力语音合成开源
CSM 是一个由 Sesame 开发的对话式语音生成模型,它能够根据文本和音频输入生成高质量的语音。该模型基于 Llama 架构,并使用 Mimi 音频编码器。它主要用于语音合成和交互式语音应用,例如语音助手和教育工具。CSM 的主要优点是能够生成自然流畅的语音,并且可以通过上下文信息优化语音输出。该模型目前是开源的,适用于研究和教育目的。
Sesame CSM 最新流量情况
月总访问量
474564576
跳出率
36.20%
平均页面访问数
6.1
平均访问时长
00:06:34