Stable Audio Open 1.0 es un modelo de IA que utiliza un autocodificador, incrustaciones de texto basadas en T5 y un modelo de difusión basado en transformadores para generar audio estéreo de hasta 47 segundos. Genera música y audio a partir de indicaciones de texto, y admite la investigación y la experimentación para explorar las capacidades actuales de los modelos de IA generativos. El modelo se entrenó con los conjuntos de datos de Freesound y Free Music Archive (FMA), lo que garantiza la diversidad y la legalidad de los derechos de autor de los datos.