AiShi Technology a récemment lancé PixVerse V2, son outil de génération vidéo. Il s'agit d'un outil innovant basé sur un grand modèle linguistique d'IA pour la vidéo, conçu pour aider les utilisateurs à libérer leur potentiel créatif. PixVerse V2 utilise une architecture de base Diffusion+Transformer (DiT) et intègre plusieurs innovations techniques pour rendre la génération vidéo plus fluide, cohérente et intéressante.

微信截图_20240725084918.png

Ses principales caractéristiques incluent :

  • Mécanisme d'attention spatio-temporelle : PixVerse V2 intègre un mécanisme d'attention spatio-temporelle développé en interne, améliorant sa capacité de perception de l'espace et du temps, particulièrement efficace pour les scènes complexes.

  • Capacité de compréhension du texte : Grâce à un modèle multi-modal, PixVerse V2 aligne plus précisément les informations textuelles et vidéo, améliorant ainsi sa compréhension et son expressivité.

  • Optimisation de l'entraînement du modèle : Basé sur les modèles flow traditionnels, PixVerse V2 utilise une perte pondérée pour accélérer et optimiser la convergence du modèle, améliorant ainsi l'efficacité globale de l'entraînement.

  • Capacité de génération vidéo : PixVerse V2 permet de générer plusieurs segments vidéo simultanément. Un segment peut atteindre 8 secondes, et plusieurs segments peuvent atteindre 40 secondes, tout en maintenant la cohérence entre les segments.

  • Fonctionnalités conviviales : PixVerse V2 permet de générer en un clic 1 à 5 segments vidéo consécutifs, en maintenant la cohérence de l'image principale, du style visuel et des éléments de scène. De plus, les utilisateurs peuvent éditer à nouveau les résultats générés et ajuster le contenu vidéo de manière flexible.

L'équipe AiShi Technology prévoit plusieurs mises à jour itératives au cours des trois prochains mois afin d'offrir une meilleure expérience de génération vidéo par IA. L'objectif de PixVerse V2 est de rendre la création vidéo par IA plus simple et plus efficace, que ce soit pour enregistrer la vie quotidienne ou raconter des histoires vidéo.