MusiConGen
Transformerベースのテキストから音楽生成モデル
一般製品音楽テキストから音楽Transformerモデル
MusiConGenは、Transformerに基づくテキストから音楽生成モデルです。時間条件強化により、リズムとコードの制御を向上させています。MusicGen-melodyフレームワークを事前学習させたモデルをファインチューニングして作成されました。記号で表されたコードとリズム制御を使用し、5つの異なるスタイルのテキスト記述を組み合わせてサンプルを生成します。生成されたサンプルのコードは、論文で述べられているように、BTCコード認識モデルによって推定されます。