Snap Vídeo
Snap Vídeo: Um conversor espaço-temporal escalável para síntese de texto para vídeo
Produto ComumVídeoSíntese de vídeoTransformer
Snap Vídeo é um modelo priorizando vídeo que aborda sistematicamente os desafios de fidelidade de movimento, qualidade visual e escalabilidade no domínio da geração de vídeo, através da extensão da estrutura EDM. O modelo utiliza informações redundantes entre quadros, propondo uma arquitetura Transformer escalável que representa as dimensões espacial e temporal como um único vetor latente 1D altamente comprimido, permitindo modelagem espaço-temporal conjunta eficiente e síntese de vídeos com alta coesão temporal e movimentos complexos. Essa arquitetura permite o treinamento eficiente do modelo, alcançando escalas de bilhões de parâmetros e obtendo resultados superiores em vários testes de benchmark.
Snap Vídeo Situação do Tráfego Mais Recente
Total de Visitas Mensais
18354
Taxa de Rejeição
52.83%
Média de Páginas por Visita
1.5
Duração Média da Visita
00:00:37