ActAnywhere

ActAnywhere é um modelo de geração de fundos de vídeo com percepção de sujeito.

Produto ComumVídeoProcessamento de VídeoGeração de Vídeo
ActAnywhere é um modelo de geração capaz de criar automaticamente fundos de vídeo que correspondem ao movimento e à aparência do sujeito em primeiro plano. Esta tarefa envolve a síntese de fundos consistentes com o movimento e a aparência do sujeito em primeiro plano, além de atender à intenção criativa do artista. ActAnywhere utiliza o poder de modelos de difusão de vídeo em larga escala e foi especialmente personalizado para esta tarefa. Recebendo como entrada uma sequência de máscaras de segmentação do sujeito em primeiro plano e uma imagem condicional que descreve a cena desejada, ActAnywhere gera um vídeo coerente que corresponde aos quadros condicionais, ao mesmo tempo em que permite uma interação realista entre o primeiro plano e o fundo. O modelo foi treinado em um grande conjunto de dados de vídeos de interação humano-computador. Amplas avaliações demonstram que o desempenho do modelo é significativamente superior aos métodos de referência e que ele pode ser generalizado para vários exemplos de distribuição, incluindo sujeitos não humanos.
Abrir Site

ActAnywhere Alternativas