Récemment, un modèle de génération de musique open source nommé NotaGen a fait son apparition, devenant rapidement un sujet phare de l'intersection entre l'IA et l'art. Ce modèle se distingue par sa capacité à générer de la musique classique de haute qualité, tout en prenant également en charge la création de musique populaire, démontrant ainsi le formidable potentiel de l'IA dans le domaine musical.
NotaGen utilise un schéma d'entraînement similaire à celui des grands modèles linguistiques (LLM). Pré-entraîné sur un vaste ensemble de données comprenant plus de 1,6 million d'œuvres musicales, il assure une capacité de génération impressionnante.
Hier, les développeurs ont annoncé la mise en open source complète du modèle et du code de NotaGen, offrant ainsi un accès gratuit aux mélomanes, développeurs et chercheurs du monde entier. Cette publication open source inclut non seulement la version de base, mais également un modèle amélioré, NotaGen-X, inspiré de DeepSeekR1. NotaGen-X, qui nécessite 24 Go de VRAM pour une installation locale, offre des performances supérieures et convient aux utilisateurs exigeant une expérience optimale. Il est toutefois important de noter que NotaGen ne génère pas de fichiers audio directement lisibles, mais des partitions musicales sous forme de fichiers ABC et XML, facilitant ainsi leur édition et leur conversion ultérieure.
Le principal atout de NotaGen réside dans son haut degré de contrôlabilité et de professionnalisme. Les utilisateurs peuvent spécifier l'époque et le style musical (Baroque, Classique, Romantique, etc.), ainsi que le type d'instrument (clavier, orchestre, etc.), afin de générer des partitions répondant à leurs besoins. Pour améliorer encore la qualité de la génération de musique classique, le modèle a été finement ajusté sur un ensemble de données spécialisé comprenant 8948 partitions classiques et couvrant 152 compositeurs. Les tests montrent que la qualité des partitions générées se rapproche de celle d'un compositeur professionnel, avec des détails riches et un style précis.
La décision de rendre NotaGen open source élargit considérablement ses applications. Pour les compositeurs professionnels, il s'agit d'un outil d'inspiration efficace ; pour les amateurs, il abaisse le seuil de création musicale. Des critiques soulignent que la méthode de génération de partitions de NotaGen, basée sur les indications « époque - compositeur - instrument », est non seulement simple d'utilisation, mais répond également à des besoins créatifs variés. Ses performances dans le domaine de la musique populaire sont également très attendues, et il pourrait à l'avenir prendre en charge davantage de styles musicaux.
Le lancement de NotaGen marque une nouvelle étape dans la technologie de génération de musique par IA. Il injecte non seulement une vitalité technologique dans la création artistique, mais stimule également la collaboration et l'innovation au sein de la communauté grâce à son modèle open source. Que ce soit pour la préservation de la musique classique ou l'exploration de la musique populaire, NotaGen présente un potentiel illimité et mérite une attention soutenue.