SenseTime a officiellement lancé son premier modèle de génération de vidéos de personnages contrôlables révolutionnaire, « Vimi ».
Vimi, fruit du développement de SenseTime basé sur ses puissantes capacités de modèle DayDayNew, a permis une flexibilité sans précédent dans la génération de vidéos. Il peut recevoir diverses entrées, telles que des vidéos d'actions, des animations de haute qualité, des fichiers audio riches et même des descriptions textuelles, comme éléments moteurs, pour contrôler et transformer précisément les images de personnages, afin de générer des vidéos de personnages parfaitement assorties aux mouvements cibles. Ce processus met non seulement en évidence la grande capacité d'adaptation de l'IA aux scénarios complexes, mais illustre également l'expérience approfondie de SenseTime dans la technologie de génération de vidéos.
Il est particulièrement remarquable que Vimi se distingue par son excellente contrôlabilité. Il dépasse les limites des techniques traditionnelles de contrôle des expressions faciales sur les images, permettant non seulement d'ajuster finement les changements d'expressions des personnages, mais aussi de contrôler précisément les mouvements corporels. Cette capacité révolutionnaire permet à Vimi de générer un contenu vidéo à la fois logique et réaliste. De plus, le traitement des détails tels que les cheveux, les vêtements et l'arrière-plan atteint un niveau de finesse sans précédent, prenant en charge les variations naturelles de la lumière et de l'ombre, offrant ainsi aux spectateurs une expérience visuelle immersive.
En termes de stabilité et de durée de la génération vidéo, Vimi démontre également des capacités exceptionnelles. Il peut générer de manière stable des vidéos de personnages à un seul plan d'une durée allant jusqu'à 1 minute, ce qui dépasse les limites actuelles de la durée de génération de vidéos IA par les grands modèles. Plus important encore, avec l'augmentation de la durée de la vidéo, la qualité de l'image générée par Vimi reste constante, sans dégradation ni distorsion, garantissant la cohérence et la haute qualité du contenu vidéo.
Adresse pour demander une expérience : https://www.wjx.cn/vm/mhSxfGv.aspx