Le modèle vidéo Vidu, fruit de la collaboration entre Baidu Intelligent Cloud et Shengshu Technology, est officiellement lancé, ouvrant de nouvelles perspectives pour le secteur créatif. Vidu est le premier modèle vidéo entièrement auto-développé en Chine, dont les performances sont comparables à celles de Sora d'OpenAI. Destiné aux domaines de la conception artistique, de la création de jeux vidéo, de l'animation cinématographique et du divertissement social, il vise à stimuler la productivité et la créativité de tous.
Vidu offre deux fonctionnalités principales : la génération de vidéos à partir de texte et la génération de vidéos à partir d'images, avec des durées de 4 et 8 secondes au choix, et une résolution maximale de 1080p. Tout en maintenant une haute dynamique, un réalisme et une cohérence élevés, il intègre des capacités spécifiques telles que la cohérence des personnages, le style animé et la génération de texte et d'effets spéciaux. La vitesse d'inférence de Vidu est rapide ; le temps d'attente pour la génération d'un segment vidéo de 4 secondes n'est que de 30 secondes, soit deux fois plus rapide que le meilleur niveau du secteur, offrant ainsi aux utilisateurs une expérience de création quasi transparente.
Baidu Intelligent Cloud fournit à Vidu des services d'entraînement de modèles à grande échelle, systématiques et de bout en bout, incluant un support de puissance de calcul massive et une garantie complète de la chaîne. Vidu utilise la plateforme de calcul hétérogène AI Baidu Baige, permettant un développement de modèles à grande échelle « rapide, stable et économique », avec un temps d'entraînement efficace atteignant 98,8 %.
Avec le lancement officiel de Vidu, Shengshu Technology et Baidu Intelligent Cloud espèrent stimuler l'innovation technologique pour permettre à l'IA de façonner l'avenir de la créativité, révéler les applications de modèles multimodaux dans davantage de scénarios et nous conduire vers un monde numérique plus efficace, plus pratique et plus créatif.