Stability AI et Arm collaborent pour lancer une technologie de génération audio hors ligne

AIbase基地

Publié leActualités IA · 4 minutes de lecture · Mar 4, 2025

15.9k

Stability AI est connu pour son modèle de génération d'images à partir de texte, Stable Diffusion. Récemment, la société a collaboré avec Arm, géant mondial des semi-conducteurs, pour intégrer des capacités d'intelligence artificielle de génération audio sur les appareils mobiles. Ce partenariat permet au modèle Stable Audio Open de fonctionner entièrement sur les processeurs Arm, permettant aux utilisateurs de générer rapidement des effets sonores, des échantillons audio et des éléments de production directement sur leur appareil, sans connexion internet.

Stability AI affirme que l'utilisation croissante de l'intelligence artificielle générative par les entreprises et les créateurs professionnels souligne l'importance de garantir que nos modèles et nos workflows soient facilement accessibles dans tous les domaines de la création. Cela améliore non seulement l'efficacité de la création, mais contribue également à l'intégration transparente de ces technologies dans les flux de production de médias visuels.

Face à la demande croissante, la société vise à améliorer l'efficacité de ses modèles sur les appareils périphériques. Lors de l'optimisation du modèle Stable Audio Open pour les appareils mobiles, les tests initiaux ont montré un temps de génération audio de 240 secondes sur un appareil avec processeur Arm. Grâce à la distillation du modèle et à l'utilisation de la pile logicielle Arm, notamment le noyau de multiplication matricielle int8 de KleidiAI via XNNPack, la société a réussi à réduire le temps de génération d'un fragment audio de 11 secondes à 8 secondes, soit une amélioration de la vitesse de réponse de 30 fois.

Il est important de noter que les utilisateurs ont besoin d'un appareil mobile compatible pour utiliser cette fonctionnalité. Étant donné que la plupart des smartphones actuels sont équipés de processeurs Arm, cette technologie est accessible à un large public. À l'avenir, Stability AI prévoit d'intégrer tous ses modèles dans les domaines de l'image, de la vidéo et de la 3D sur les appareils périphériques, dans le but de révolutionner la création de médias visuels sur les appareils mobiles.

Points clés :
🌟 Stability AI s'associe à Arm pour lancer une technologie de génération audio hors ligne sur les appareils mobiles.
⚡ Grâce à la distillation du modèle et à l'optimisation logicielle, le temps de génération audio est passé de 240 secondes à 8 secondes, soit un gain d'efficacité de 30 fois.
📱 Cette technologie est utilisable sur la plupart des smartphones équipés d'un processeur Arm, et sera étendue à d'autres domaines de création multimédia.

LanPaint : méthode de repeinture partielle par inférence, réparation d'images sans entraînement

Récemment, le développeur scraed a publié sur GitHub LanPaint, un outil de réparation d'images ne nécessitant aucun entraînement supplémentaire. Cet outil vise à aider les utilisateurs à obtenir des résultats de réparation d'images de haute qualité sur n'importe quel modèle de diffusion stable (SD), y compris les modèles personnalisés entraînés par l'utilisateur. LanPaint permet au modèle de « réfléchir » avant le débruitage par itérations multiples, afin d'obtenir des résultats de réparation plus fluides et précis. L'une des principales caractéristiques de LanPaint est la réparation sans entraînement. Les utilisateurs peuvent immédiatement...

Rapport Deloitte : 74 % des entreprises ont atteint ou dépassé le retour sur investissement de l'IA générative

À l'échelle mondiale, les entreprises de tous types s'efforcent de comprendre l'intelligence artificielle générative (IA générative) et d'explorer sa valeur potentielle. Selon un récent rapport de Deloitte sur l'état de l'intelligence artificielle générative, la plupart des organisations obtiennent en fait de bons résultats en matière de retour sur investissement. Ce rapport, basé sur une enquête menée auprès de 2 773 dirigeants dans 14 pays, révèle les progrès et les défis des organisations en matière d'application de l'intelligence artificielle générative. Légende de l'image : Image générée par IA, fournisseur de services d'autorisation d'images Midjourney.

238 services d'intelligence artificielle générative enregistrés auprès du Cyberspace Administration of China en 2024

Le 8 janvier, le Bureau d'information Internet de Chine a publié un communiqué sur l'enregistrement des services d'intelligence artificielle générative, soulignant l'importance de promouvoir l'innovation et la réglementation dans ce domaine. Conformément aux dispositions des "Règles provisoires sur la gestion des services d'intelligence artificielle générative", le département de la cybersécurité continuera à promouvoir l'enregistrement des services d'intelligence artificielle générative. Au 31 décembre 2024, 302 services d'intelligence artificielle générative avaient été enregistrés auprès du Cyberspace Administration of China, dont 238 nouveaux services enregistrés en 2024. Cela montre que le domaine de l'intelligence artificielle générative est en pleine expansion...

Shanghai ajoute 9 nouveaux services d'intelligence artificielle générative enregistrés

L'office de cybersécurité de Shanghai a publié un nouveau communiqué concernant l'enregistrement des services d'intelligence artificielle générative, visant à promouvoir l'innovation et l'utilisation réglementée de l'IA générative dans la ville. Conformément aux dispositions du « Règlement provisoire sur la gestion des services d'intelligence artificielle générative », Shanghai a procédé à l'enregistrement ordonné des services d'IA générative et a enregistré les services utilisant les capacités des modèles enregistrés via une API ou d'autres moyens. À ce jour, Shanghai a ajouté 9 nouveaux services d'IA générative enregistrés, portant le nombre total de services enregistrés à 63. Cet enregistrement...