Le modèle vidéo génératif Vidu de Shengshu Technology est lancé, entraîné par Baidu Intelligent Cloud

AIbase基地

Publié leActualités IA · 4 minutes de lecture · Jul 30, 2024

590

Le modèle vidéo Vidu, fruit de la collaboration entre Baidu Intelligent Cloud et Shengshu Technology, est officiellement lancé, ouvrant de nouvelles perspectives pour le secteur créatif. Vidu est le premier modèle vidéo entièrement auto-développé en Chine, dont les performances sont comparables à celles de Sora d'OpenAI. Destiné aux domaines de la conception artistique, de la création de jeux vidéo, de l'animation cinématographique et du divertissement social, il vise à stimuler la productivité et la créativité de tous.

Vidu offre deux fonctionnalités principales : la génération de vidéos à partir de texte et la génération de vidéos à partir d'images, avec des durées de 4 et 8 secondes au choix, et une résolution maximale de 1080p. Tout en maintenant une haute dynamique, un réalisme et une cohérence élevés, il intègre des capacités spécifiques telles que la cohérence des personnages, le style animé et la génération de texte et d'effets spéciaux. La vitesse d'inférence de Vidu est rapide ; le temps d'attente pour la génération d'un segment vidéo de 4 secondes n'est que de 30 secondes, soit deux fois plus rapide que le meilleur niveau du secteur, offrant ainsi aux utilisateurs une expérience de création quasi transparente.

微信截图_20240730171903.png

Baidu Intelligent Cloud fournit à Vidu des services d'entraînement de modèles à grande échelle, systématiques et de bout en bout, incluant un support de puissance de calcul massive et une garantie complète de la chaîne. Vidu utilise la plateforme de calcul hétérogène AI Baidu Baige, permettant un développement de modèles à grande échelle « rapide, stable et économique », avec un temps d'entraînement efficace atteignant 98,8 %.

Avec le lancement officiel de Vidu, Shengshu Technology et Baidu Intelligent Cloud espèrent stimuler l'innovation technologique pour permettre à l'IA de façonner l'avenir de la créativité, révéler les applications de modèles multimodaux dans davantage de scénarios et nous conduire vers un monde numérique plus efficace, plus pratique et plus créatif.

Alibaba open-source le modèle vidéo texte-vers-vidéo Wanxiang 2.1 : versions 14B et 1,3B disponibles

Aujourd'hui, Alibaba a annoncé la mise en open source complète de son modèle de génération de vidéo Wanxiang 2.1, avec les versions 14B et 1,3B disponibles. La version professionnelle 14B, haute performance, offre des performances de pointe pour les scénarios exigeant une qualité vidéo exceptionnelle ; tandis que la version ultrarapide 1,3B, adaptée aux cartes graphiques grand public, permet de générer des vidéos 480p de haute qualité avec seulement 8,2 Go de VRAM, et convient au développement de modèles secondaires et à la recherche académique. Selon les informations officielles, le Wanxiang 2.1 open-source amélioré dans la gestion des mouvements complexes, la restitution des lois physiques réelles, l'amélioration de la qualité cinématographique...

Recrutement de testeurs pour le modèle vidéo Hunyuan de Tencent : une publication en open source en perspective

Tencent a récemment annoncé sur X le recrutement de testeurs pour son modèle vidéo Hunyuan (Hunyuan Video), marquant ainsi une étape cruciale pour cette technologie de pointe de génération de vidéo IA. D'après les informations officielles, il y a de fortes chances que le modèle soit publié en open source après la phase de test, contribuant ainsi aux avancées de la communauté IA mondiale. Le modèle vidéo Hunyuan représente une innovation majeure de Tencent dans le domaine de la génération de vidéo IA. Avec plus de 13 milliards de paramètres, il s'agit de l'un des plus grands modèles de génération de vidéo open source à ce jour. Ses technologies clés incluent...

Le modèle vidéo IA « de niveau bombe nucléaire » Veo 2 de Google fait ses débuts sur Freepik : les 10 000 premiers utilisateurs peuvent l'utiliser gratuitement

Le domaine de la vidéo IA accueille un nouveau produit révolutionnaire ! Google vient de lancer son modèle vidéo IA de dernière génération, Veo2, en exclusivité mondiale sur la plateforme de ressources Freepik. Cette sortie marque non seulement une nouvelle percée majeure de Google dans la technologie vidéo IA, mais offre également une surprise de taille : les 10 000 premiers utilisateurs pourront tester gratuitement cette « technologie de pointe », offrant ainsi aux créateurs vidéo un avantage considérable ! Selon les informations publiées sur Twitter, Veo2 est considéré comme un produit de Google...

Actualités IA

Le modèle vidéo génératif Vidu de Shengshu Technology est lancé, entraîné par Baidu Intelligent Cloud

AIbase基地

Recommandations d'actualités IA connexes

Lancement d'un site Web indépendant pour Tongyi Wanxiang, le modèle vidéo IA d'Alibaba

Alibaba open-source le modèle vidéo texte-vers-vidéo Wanxiang 2.1 : versions 14B et 1,3B disponibles

Recrutement de testeurs pour le modèle vidéo Hunyuan de Tencent : une publication en open source en perspective

Le modèle vidéo IA « de niveau bombe nucléaire » Veo 2 de Google fait ses débuts sur Freepik : les 10 000 premiers utilisateurs peuvent l'utiliser gratuitement