Em 22 de janeiro de 2025, a Shanghai Jieyue Xingchen Intelligent Technology Co., Ltd. anunciou a atualização oficial de seu modelo de geração de vídeo, Step-Video, para a versão V2. Esta atualização trouxe avanços tecnológicos significativos e melhorias funcionais, tornando-o mais poderoso na simulação do mundo real.

A versão V2 do Step-Video foi otimizada e inovada em várias áreas de tecnologia central. Primeiro, esta versão adotou um modelo VAE com maior taxa de compressão. Através da compressão eficiente espacial e temporal, reduz significativamente a complexidade computacional e melhora a eficiência de geração, garantindo ao mesmo tempo a qualidade da reconstrução. Em segundo lugar, o Step-Video V2 otimizou profundamente a arquitetura DiT e introduziu um algoritmo de aprendizado por reforço, melhorando ainda mais a fluidez e a riqueza de detalhes na geração de vídeos. Além disso, esta versão combina o modelo de compreensão multimodal de grande escala e o banco de dados de conhecimento de vídeo desenvolvidos internamente, permitindo uma descrição mais precisa do conteúdo do vídeo e da linguagem de filmagem, gerando vídeos mais próximos da realidade.

微信截图_20250123090916.png

Em aplicações práticas, o Step-Video V2 demonstrou uma poderosa capacidade de geração de movimentos complexos. Seja balé, karatê ou badminton, ele consegue apresentar cenas dinâmicas com fluidez. Simultaneamente, o modelo apresenta excelente desempenho na captura de expressões faciais, conseguindo representar com detalhes as expressões e efeitos de luz e sombra de personagens reais ou fictícios. Além disso, o Step-Video V2 suporta uma rica linguagem de filmagem, incluindo vários movimentos de câmera como panorâmica, zoom e travelling, bem como transições entre diferentes planos, oferecendo mais possibilidades para a criação de vídeos.

Vale mencionar que o Step-Video V2 adicionou uma função básica de geração de texto, capaz de integrar texto naturalmente ao conteúdo do vídeo, com resultados significativamente melhores do que o modelo anterior. A inclusão desta função expande ainda mais os cenários de aplicação da geração de vídeo.

Atualmente, o Step-Video V2 está disponível para solicitação de teste no site da Yuewen (https://yuewen.cn/videos), onde os usuários podem experimentar os poderosos recursos desta atualização.

Esta atualização não apenas marca o progresso tecnológico da Jieyue Xingchen na área de geração de vídeo, mas também fornece aos criadores ferramentas mais poderosas, impulsionando a criação de vídeos para uma nova fase.