Stable Audio Open demo

从文本提示生成立体声音频

普通产品音乐音频生成文本到音频
Stable Audio Open 是一个能够从文本提示生成长达47秒的立体声音频的技术。它包含三个主要组件:一个将波形压缩到可管理序列长度的自编码器、一个基于T5的文本嵌入用于文本条件、以及一个在自编码器的潜在空间中操作的基于变换的扩散(DiT)模型。该技术在生成音频方面表现出色,能够根据文本提示生成各种类型的音频,如打击乐、电子音乐、自然声音等。
打开网站

Stable Audio Open demo 最新流量情况

月总访问量

1809

跳出率

46.33%

平均页面访问数

1.0

平均访问时长

00:00:00

Stable Audio Open demo 访问量趋势

Stable Audio Open demo 访问地理位置分布

Stable Audio Open demo 流量来源

Stable Audio Open demo 替代品