Le 22 janvier 2025, Shanghai Jieyue Xingchen Intelligent Technology Co., Ltd. a annoncé la mise à jour officielle de son modèle de génération vidéo Step-Video à la version V2. Cette mise à jour apporte des percées technologiques et des améliorations fonctionnelles significatives, le rendant plus puissant dans la simulation du monde réel.
Step-Video V2 a été optimisé et innové dans plusieurs domaines technologiques clés. Premièrement, cette version utilise un modèle VAE avec un taux de compression plus élevé. Grâce à une compression spatiale et temporelle efficace, elle réduit considérablement la complexité de calcul et améliore l'efficacité de la génération tout en garantissant la qualité de la reconstruction. Deuxièmement, Step-Video V2 a optimisé en profondeur l'architecture DiT et introduit un algorithme d'apprentissage par renforcement, améliorant ainsi la fluidité et la finesse des détails de la génération vidéo. De plus, cette version combine un grand modèle linguistique multimodal propriétaire et une base de données de connaissances vidéo pour décrire plus précisément le contenu vidéo et le langage cinématographique, générant ainsi des vidéos plus proches de la réalité.
Dans les applications pratiques, Step-Video V2 a démontré une puissante capacité de génération de mouvements complexes. Que ce soit pour le ballet, le karaté ou le badminton, il peut présenter des images dynamiques fluides. Simultanément, le modèle excelle dans la capture des expressions faciales, capable de restituer finement les expressions et les effets de lumière des personnages réels ou fictifs. De plus, Step-Video V2 prend en charge un langage cinématographique riche, incluant divers mouvements de caméra (travelling, zoom, panoramique) et des changements d'angles de vue, offrant ainsi davantage de possibilités pour la création vidéo.
Il est à noter que Step-Video V2 ajoute une fonction de génération de texte de base, capable d'intégrer naturellement du texte dans le contenu vidéo, avec des résultats significativement meilleurs que les modèles précédents. L'ajout de cette fonctionnalité élargit encore les applications de la génération vidéo.
Actuellement, Step-Video V2 est disponible en demande d'essai sur la page web Yuewen (https://yuewen.cn/videos). Les utilisateurs peuvent ainsi découvrir les fonctionnalités améliorées de cette mise à jour.
Cette mise à jour marque non seulement les progrès technologiques de Jieyue Xingchen dans le domaine de la génération vidéo, mais fournit également aux créateurs des outils plus puissants, propulsant la création vidéo vers une nouvelle étape.