VideoDrafter
Geração de vídeos multi-cena com conteúdo consistente
Produto ComumVídeoGeração de vídeoConteúdo consistente
O VideoDrafter é uma estrutura para a geração de vídeos multi-cena com conteúdo consistente. Ele utiliza modelos de linguagem de grande porte (LLM) para converter prompts de entrada em scripts abrangentes que incluem scripts multi-cena, contendo prompts que descrevem eventos, entidades em primeiro plano/plano de fundo e movimentos de câmera. O VideoDrafter identifica entidades comuns nos scripts e solicita ao LLM uma descrição detalhada de cada entidade. Em seguida, a descrição de cada entidade é inserida em um modelo de texto para imagem para gerar uma imagem de referência para cada entidade. Por fim, considerando as imagens de referência, a descrição dos eventos e o movimento da câmera, um vídeo multi-cena é gerado através de um processo de difusão. O modelo de difusão processa as imagens de referência como condicionais e alinhadas para melhorar a consistência de conteúdo do vídeo multi-cena.
VideoDrafter Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44