Stability AI es conocida por su modelo de generación de imágenes a partir de texto, Stable Diffusion. Recientemente, la compañía se asoció con Arm, el gigante mundial de semiconductores, para llevar la capacidad de generar audio con inteligencia artificial a los dispositivos móviles. Esta colaboración permite que el modelo Stable Audio Open se ejecute completamente en la CPU Arm, permitiendo a los usuarios generar rápidamente efectos de sonido, muestras de audio y elementos de producción en sus dispositivos sin necesidad de conexión a internet.
Stability AI afirma que, a medida que la inteligencia artificial generativa se utiliza cada vez más en empresas y entre creadores profesionales, es crucial asegurar que nuestros modelos y flujos de trabajo sean fácilmente accesibles en todos los ámbitos creativos. Esto no solo mejora la eficiencia creativa, sino que también ayuda a integrar estas tecnologías sin problemas en los flujos de trabajo de producción de medios visuales.
Para satisfacer la creciente demanda, la compañía busca mejorar la eficiencia de sus modelos en dispositivos periféricos. Durante la optimización del modelo Stable Audio Open para dispositivos móviles, las pruebas iniciales mostraron un tiempo de generación de audio de 240 segundos en un dispositivo con CPU Arm. Mediante la destilación del modelo y el uso del stack de software de Arm, especialmente el núcleo de multiplicación de matrices int8 de KleidiAI en XNNPack, la compañía logró reducir el tiempo de generación de un fragmento de audio de 11 segundos a 8 segundos, lo que representa una mejora de 30 veces en la velocidad de respuesta.
Cabe destacar que se necesita un dispositivo móvil compatible para disfrutar de esta función. Dado que la mayoría de los smartphones actuales cuentan con CPU con arquitectura Arm, esta tecnología es accesible para una amplia gama de usuarios. En el futuro, Stability AI planea llevar todos sus modelos en las áreas de imagen, video y 3D a dispositivos periféricos, con el objetivo de revolucionar la creación de medios visuales en dispositivos móviles.
Puntos clave:
🌟 Stability AI se asocia con Arm para lanzar una tecnología que permite la generación de audio sin conexión en dispositivos móviles.
⚡ Gracias a la destilación del modelo y la optimización del software, el tiempo de generación de audio se redujo de 240 segundos a 8 segundos, mejorando la eficiencia en 30 veces.
📱 Esta tecnología funciona en la mayoría de los smartphones con CPU Arm, y en el futuro se expandirá a más áreas de creación de medios.