म्यूज़िकॉनजेन (MusiConGen)
ट्रांसफ़ॉर्मर-आधारित पाठ-से-संगीत निर्माण मॉडल
सामान्य उत्पादसंगीतपाठ-से-संगीतट्रांसफ़ॉर्मर मॉडल
म्यूज़िकॉनजेन एक ट्रांसफ़ॉर्मर-आधारित पाठ-से-संगीत निर्माण मॉडल है जो समय-नियंत्रण वृद्धि के माध्यम से ताल और कॉर्ड्स पर नियंत्रण को बेहतर बनाता है। यह मॉडल पूर्व-प्रशिक्षित MusicGen-melody ढाँचे से बेहतर बनाया गया है। यह प्रतीकात्मक रूप से दर्शाए गए कॉर्ड्स और ताल नियंत्रण का उपयोग करता है और पाँच विभिन्न शैलियों के पाठ विवरणों को मिलाकर नमूने उत्पन्न करता है। उत्पन्न नमूनों के कॉर्ड्स का अनुमान BTC कॉर्ड पहचान मॉडल द्वारा लगाया जाता है, जैसा कि शोध पत्र में वर्णित है।