AudioLM

高品質オーディオ生成フレームワーク

一般製品その他オーディオ生成言語モデル
AudioLMはGoogle Researchが開発した、長期的な一貫性を備えた高品質オーディオ生成のためのフレームワークです。入力オーディオを離散トークンシーケンスにマッピングし、オーディオ生成をこの表現空間における言語モデリングタスクとして扱います。大量の生のオーディオ波形データで訓練することで、自然で首尾一貫したオーディオの続きを生成します。テキストや注釈がなくても、話者のアイデンティティやリズムを維持しながら、文法上および意味的に妥当な音声の続きを生成できます。さらに、訓練時に音楽記号表現を使用していなくても、首尾一貫したピアノ音楽の続きを生成できます。
ウェブサイトを開く

AudioLM 最新のトラフィック状況

月間総訪問数

26710

直帰率

49.93%

平均ページ/訪問

1.2

平均訪問時間

00:00:07

AudioLM 訪問数の傾向

AudioLM 訪問地理的分布

AudioLM トラフィックソース

AudioLM 代替品