Récemment, le laboratoire Tongyi a officiellement publié en open source sa technologie innovante de génération musicale : InspireMusic. Cette technologie vise à créer une boîte à outils AIGC open source intégrant la génération de musique, de chansons et d'audio, offrant ainsi une plateforme complète aux chercheurs, aux développeurs et aux mélomanes.
InspireMusic fournit non seulement aux chercheurs et aux développeurs des outils complets d'entraînement et d'optimisation des modèles de génération musicale/de chansons/d'audio, mais aussi des modèles efficaces pour optimiser les résultats de génération. Simultanément, cet outil réduit considérablement le seuil de création musicale, permettant aux mélomanes de générer facilement des œuvres musicales diversifiées à partir de descriptions textuelles ou d'indications audio simples.
Le mode de création musicale à partir de texte d'InspireMusic est particulièrement remarquable. Il couvre une variété de styles musicaux, d'expressions émotionnelles et de contrôles de structure musicale complexes, offrant aux utilisateurs une grande liberté et flexibilité de création. Les utilisateurs peuvent, selon leurs préférences, générer des œuvres musicales répondant à leurs besoins en entrant une description textuelle ; que ce soit du jazz relaxant ou des mélodies enfantines, InspireMusic peut tout reproduire.
De plus, InspireMusic dispose d'une conception de mode d'inférence flexible, incluant des modèles rapides et des modèles haute fidélité, afin de répondre aux besoins des différents utilisateurs. Que les utilisateurs recherchent une génération rapide ou une sortie de haute qualité, ils trouveront dans cette boîte à outils le mode de création qui leur convient.
Actuellement, InspireMusic a publié en open source le code d'entraînement et d'inférence de la génération musicale. Les utilisateurs peuvent y accéder et l'utiliser via le dépôt GitHub, l'espace de création ModelScope et HuggingFace Spaces.
À l'avenir, le laboratoire Tongyi prévoit d'ouvrir davantage les modèles de base de génération vocale et de génération audio d'InspireMusic, afin d'attirer davantage de chercheurs, de développeurs et d'utilisateurs à participer activement à l'expérience et à la recherche et développement. Nous pensons qu'avec les efforts conjugués de tous, InspireMusic ne cessera de s'améliorer et apportera davantage de surprises au domaine de la création musicale.
Dépôt GitHub : InspireMusic (https://github.com/FunAudioLLM/InspireMusic)
Démo en ligne :
Espace de création ModelScope : https://modelscope.cn/studios/iic/InspireMusic/summary
HuggingFace Spaces : https://huggingface.co/spaces/FunAudioLLM/InspireMusic