DiffRhythm
DiffRhythm est une technique de génération de morceaux complets de bout en bout basée sur un modèle de diffusion latente, capable de générer en peu de temps des chansons complètes comprenant des voix et un accompagnement.
Produit OrdinaireMusiqueGénération musicaleIntelligence artificielle
DiffRhythm est un modèle innovant de génération musicale qui utilise la technique de diffusion latente pour permettre une génération de morceaux complets rapide et de haute qualité. Cette technologie révolutionne les méthodes traditionnelles de génération musicale, sans architecture multi-étapes complexe ni préparation fastidieuse des données. Seuls des paroles et des indications de style sont nécessaires pour générer en peu de temps une chanson complète de 4 minutes et 45 secondes. Sa structure non autorégressive garantit une vitesse d'inférence rapide, améliorant considérablement l'efficacité et l'évolutivité de la création musicale. Ce modèle a été développé conjointement par le groupe de traitement audio, vocal et linguistique (ASLP@NPU) de l'Université de technologie du Nord-Ouest et l'Institut de recherche sur les mégadonnées de l'Université chinoise de Hong Kong (Shenzhen), dans le but de fournir une solution simple, efficace et créative pour la création musicale.