Google a officiellement lancé son nouveau modèle de génération de vidéo, Veo2, visant à concurrencer Sora d'OpenAI. Google affirme que Veo2 offre un réalisme et une finesse supérieurs lors de la génération de vidéos. Cette mise à jour améliore non seulement la qualité vidéo, mais renforce également la compréhension de la physique réelle et des nuances des mouvements et expressions humains.
Les puissantes fonctionnalités de Veo2
Google indique que Veo2 « comprend mieux la physique du monde réel ainsi que les nuances des mouvements et des expressions humaines ». Il est accessible sur la plateforme VideoFX de Google Labs, mais uniquement sur liste d'attente. Les utilisateurs doivent s'inscrire via un formulaire Google et attendre que Google leur accorde un accès temporaire à un moment choisi par Google.
Google précise que les utilisateurs peuvent choisir le type de vidéo, les plans et les effets cinématographiques selon leurs besoins. Veo2 peut générer des vidéos jusqu'à une résolution 4K.
En comparaison, la version originale de Veo reste disponible sur Vertex AI. Les vidéos générées par Veo2 seront accompagnées du filigrane de métadonnées SynthID de Google, afin d'identifier leur création par IA.
Bien que Veo2 représente une avancée technique, Google reconnaît que le modèle peut parfois présenter des « hallucinations », comme la génération de doigts supplémentaires, mais globalement, les phénomènes d'hallucinations sont réduits dans cette nouvelle version.
Google affirme que lors de ses tests internes, en mesurant les « préférences globales » (c'est-à-dire les vidéos préférées du public) et la « conformité aux instructions » (la correspondance entre la vidéo et les instructions données par les créateurs humains), les évaluateurs humains ont préféré Veo à Sora et aux autres modèles d'IA concurrents.
Accès à Veo2 : https://labs.google/fx/tools/video-fx
Présentation : https://deepmind.google/technologies/veo/veo-2/
La génération de vidéos par IA nécessite encore des efforts
Bien que la technologie de génération de vidéos par IA progresse constamment, la compétition entre Google, OpenAI et d'autres grands acteurs reste féroce. D'autres petites entreprises, comme RunwayML et Luma AI, lancent continuellement de nouvelles fonctionnalités pour améliorer leurs capacités de génération de vidéos.
Récemment, RunwayML a lancé des fonctionnalités de contrôle avancées pour le modèle Gen-3Alpha Turbo, tandis que Pika Labs a publié Pika2.0, permettant aux utilisateurs d'ajouter leurs propres personnages aux vidéos.
Cependant, la confiance des utilisateurs envers les vidéos générées par IA reste limitée. Le lancement de Sora n'a pas complètement dissipé les doutes, certains utilisateurs signalant des incohérences physiques et anatomiques dans les résultats générés. De plus, lors d'une récente cérémonie de remise de prix de jeux vidéo, les spectateurs ont exprimé leur mécontentement face au « chaos de l'IA » dans les contenus générés par IA.
Google indique que de nombreux utilisateurs manifestent un vif intérêt pour Veo2, notamment des créateurs YouTube qui utilisent déjà VideoFX pour créer des arrière-plans pour leurs courtes vidéos, afin de gagner du temps.
Mise à jour d'Imagen3
En plus de Veo2, Google a également mis à jour son modèle de génération d'images Imagen3, améliorant encore le réalisme et la vivacité des couleurs des images générées. La nouvelle version d'Imagen3 est capable de représenter plus précisément une variété de styles artistiques, du réalisme photographique à l'impressionnisme, en passant par l'abstrait et l'animation. Simultanément, le modèle est plus performant dans le respect des instructions de l'utilisateur.
Points clés :
- 🎥 Google lance le modèle de génération de vidéo Veo2, affirmant que la qualité de ses vidéos est supérieure à celle de Sora d'OpenAI.
- 🚀 Les utilisateurs peuvent demander l'accès à Veo2 via un formulaire Google et choisir le style et les effets lors de la génération de vidéos.
- 🎨 Le modèle de génération d'images Imagen3 mis à jour représente mieux les différents styles artistiques, offrant une meilleure expérience utilisateur.