Diffusion-Vas
Pesquisa avançada em segmentação de objetos não visíveis em vídeo e preenchimento de conteúdo
Produto ComumVídeoSegmentação de vídeoObjetos não visíveis
Este é um modelo de segmentação de objetos não visíveis e preenchimento de conteúdo em vídeo proposto pela Universidade Carnegie Mellon. O modelo, através de uma tarefa de geração condicional, utiliza os conhecimentos básicos de modelos de geração de vídeo para processar sequências de objetos visíveis em vídeos, gerando máscaras de objetos que incluem partes visíveis e invisíveis, bem como o conteúdo RGB. As principais vantagens desta técnica incluem a capacidade de lidar com situações de alta oclusão e o processamento eficaz de objetos em deformação. Além disso, o modelo superou métodos de ponta existentes em vários conjuntos de dados, com uma melhora de desempenho de até 13% na segmentação de objetos não visíveis em áreas ocluídas.