DiffRhythm
DiffRhythmは潜在拡散モデルに基づくエンドツーエンドの全曲生成技術であり、短時間でボーカルと伴奏を含む完全な曲を生成できます。
一般製品音楽音楽生成人工知能
DiffRhythmは、潜在拡散技術を利用して、高速かつ高品質な全曲生成を実現する革新的な音楽生成モデルです。この技術は従来の音楽生成方法の限界を突破し、複雑な多段階アーキテクチャや煩雑なデータ準備を必要とせず、歌詞とスタイルプロンプトだけで短時間で最長4分45秒の完全な曲を生成できます。非自己回帰構造により高速な推論速度が保証され、音楽創作の効率と拡張性が大幅に向上します。本モデルは、西北工業大学オーディオ、音声、言語処理グループ(ASLP@NPU)と香港中文大学(深圳)ビッグデータ研究所が共同で開発し、音楽創作にシンプルで効率的かつ創造的なソリューションを提供することを目指しています。