Modelo de geração de vídeo de IA da Shengshu Science and Technology Vidu lançado globalmente; converte imagens/texto em vídeo

Hoje, a Shengshu Technology de Pequim anunciou o lançamento global do site oficial do modelo de geração de vídeo com IA, Vidu. O Vidu é um modelo que utiliza tecnologia de inteligência artificial para gerar vídeos a partir de texto ou imagens.

微信截图_20240730115537.png

Em abril deste ano, a Shengshu Technology e a Universidade Tsinghua lançaram em conjunto o primeiro grande modelo de vídeo da China - "Vidu", marcando um passo importante para a China na tecnologia de geração de vídeo.

"Vidu" utiliza a arquitetura U-ViT, de criação própria da equipe, que combina as tecnologias Diffusion e Transformer. Este inovador grande modelo de vídeo pode gerar rapidamente vídeos de alta definição de 1080P com até 16 segundos de duração, ao mesmo tempo em que demonstra alta imaginação e criatividade, simulando o mundo físico real. A capacidade de geração de múltiplas câmeras e a consistência espaço-temporal são características notáveis do "Vidu".

Desde seu lançamento, "Vidu" alcançou avanços significativos em todo o mundo, atingindo um nível de desempenho internacionalmente de ponta e continua em constante iteração e otimização. Essa conquista é resultado do profundo acúmulo da equipe em aprendizado de máquina bayesiano e modelos de grande porte multimodais, bem como de várias conquistas originais.

Com base em um profundo entendimento da arquitetura U-ViT e em vasta experiência em engenharia e dados, a equipe rapidamente superou os desafios tecnológicos cruciais da representação e processamento de vídeos longos, desenvolvendo com sucesso o grande modelo de vídeo "Vidu". "Vidu" obteve resultados significativos na melhoria da coerência e dinâmica dos vídeos, impulsionando o desenvolvimento da tecnologia de processamento de vídeo.

Endereço para experimentar: https://www.vidu.studio/

Notícias e Informações de IA

Modelo de geração de vídeo de IA da Shengshu Science and Technology Vidu lançado globalmente; converte imagens/texto em vídeo

AIbase基地