Diffusion-Vas
Recherche avancée sur la segmentation d'objets invisibles et le remplissage de contenu vidéo
Produit OrdinaireVidéoSegmentation vidéoObjet invisible
Il s'agit d'un modèle de segmentation d'objets invisibles et de remplissage de contenu vidéo proposé par l'Université Carnegie Mellon. Ce modèle, basé sur une tâche de génération conditionnelle, exploite les connaissances de base des modèles de génération vidéo pour traiter les séquences d'objets visibles afin de générer des masques d'objets incluant les parties visibles et invisibles, ainsi que le contenu RGB. Les principaux avantages de cette technologie incluent la capacité de gérer les cas de forte occlusion et de traiter efficacement les objets déformés. De plus, ce modèle surpasse les méthodes de pointe existantes sur plusieurs ensembles de données, notamment en matière de segmentation d'objets invisibles dans les zones occlusées, avec une amélioration des performances pouvant atteindre 13%.