VideoGrain est une technique d'édition vidéo basée sur un modèle de diffusion, qui permet une édition vidéo multi-granulaire grâce à l'ajustement du mécanisme d'attention spatio-temporelle. Cette technique résout les problèmes d'alignement sémantique et de couplage de caractéristiques des méthodes traditionnelles, permettant un contrôle précis du contenu vidéo. Ses principaux avantages sont sa capacité d'édition zéro-shot, son contrôle texte-vers-zone efficace et sa capacité de séparation des caractéristiques. Cette technique convient aux scénarios nécessitant une édition vidéo complexe, tels que la post-production cinématographique et la création publicitaire, et permet d'améliorer considérablement l'efficacité et la qualité de l'édition.