Potências Geradoras de Dez
Gera vídeos com zoom contínuo e multi-escala com base em descrições de texto.
Produto ComumDesignModelo GenerativoMulti-escala
Potências Geradoras de Dez é um método que usa modelos de texto para imagem para gerar conteúdo multi-escala consistente. Ele permite o zoom semântico extremo de uma cena, por exemplo, de uma vista panorâmica de uma floresta até uma fotografia em macro de um inseto em um galho. Essa representação nos permite renderizar vídeos com zoom contínuo ou explorar interativamente diferentes escalas da cena. Conseguimos isso por meio de um método de amostragem de difusão multi-escala conjunta, que incentiva a consistência entre diferentes escalas, mantendo a integridade de cada processo de amostragem individual. Como cada escala gerada é orientada por diferentes prompts de texto, nosso método permite um zoom mais profundo do que os métodos tradicionais de super-resolução, que podem ter dificuldades em criar novas estruturas contextuais em escalas completamente diferentes. Comparámos qualitativamente nosso método com técnicas alternativas de super-resolução de imagens e desenho externo, mostrando que nosso método é o mais eficaz na geração de conteúdo multi-escala consistente.
Potências Geradoras de Dez Situação do Tráfego Mais Recente
Total de Visitas Mensais
408
Taxa de Rejeição
43.27%
Média de Páginas por Visita
1.0
Duração Média da Visita
00:00:00