MelodyFlow

Modèle de génération et d'édition musicale haute-fidélité guidé par le texte

Nouveau Produit PremiumMusiqueGénération musicaleGuidage par texte
MelodyFlow est un modèle de génération et d'édition musicale haute-fidélité contrôlé par texte. Il utilise des séquences de représentations latentes continues, évitant ainsi la perte d'information inhérente aux représentations discrètes. Basé sur une architecture de transformateur de diffusion entraîné par une cible d'appariement de flux, il peut générer et éditer des échantillons stéréo de haute qualité et diversifiés, avec la simplicité d'une description textuelle. MelodyFlow explore également une nouvelle méthode d'inversion latente régularisée pour l'édition guidée par le texte lors de tests sans échantillon, démontrant des performances supérieures dans diverses invites d'édition musicale. Le modèle a été évalué sur des indicateurs objectifs et subjectifs, démontrant une qualité et une efficacité comparables aux références sur les tests de référence texte-vers-musique standard, et surpassant les techniques de pointe précédentes en matière d'édition musicale.
Ouvrir le site Web

MelodyFlow Alternatives