MelodyFlow

Modelo de generación y edición de música de alta fidelidad guiado por texto

Nuevo Producto PremiumMúsicaGeneración de músicaGuiado por texto
MelodyFlow es un modelo de generación y edición de música de alta fidelidad basado en el control de texto. Utiliza secuencias de representaciones latentes continuas, evitando la pérdida de información asociada a las representaciones discretas. Basado en una arquitectura de transformador de difusión entrenado con un objetivo de coincidencia de flujo, puede generar y editar muestras estéreo de alta calidad y diversidad con la sencillez de una descripción textual. MelodyFlow también explora un nuevo método de inversión latente regularizado para la edición guiada por texto en pruebas de cero muestra, demostrando un rendimiento superior en diversas indicaciones de edición musical. El modelo se ha evaluado con métricas objetivas y subjetivas, demostrando una calidad y eficiencia comparables a las líneas base de evaluación en pruebas de referencia estándar de texto a música, y superando el estado del arte en la edición musical.
Abrir sitio web

MelodyFlow Alternativas