Fée est une adaptation d'un modèle de diffusion d'édition d'images simple mais puissant pour les applications d'édition vidéo. Son cœur repose sur un mécanisme d'attention inter-images basé sur des ancres, qui propage implicitement les caractéristiques de diffusion entre les images, assurant ainsi une meilleure cohérence temporelle et une synthèse haute-fidélité. Fée résout non seulement les limites de mémoire et de vitesse de traitement des modèles précédents, mais améliore également la cohérence temporelle grâce à une stratégie unique d'augmentation des données.