COMOSVC
一貫性モデルに基づく歌唱ピッチ変換技術
一般製品音楽歌唱変換ピッチ変換
COMOSVCは、一貫性モデルに基づく歌唱ピッチ変換技術です。高品質な変換効果と高速なサンプリング速度を実現します。本技術は、まず拡散ベースの教師モデルを歌唱ピッチ変換タスク用に設計し、次に自己一貫性特性を用いた知識蒸留によってワンステップサンプリングを実現します。既存の最先端の拡散ベースの歌唱ピッチ変換システムと比較して、COMOSVCは同等かそれ以上の変換性能を維持しながら、大幅に高速な推論速度を実現します。