Google lance Veo et Imagen 3, des modèles de génération de vidéo et d'image révolutionnaires

Récemment, la division Cloud de Google a annoncé que ses derniers modèles de génération de vidéos et d'images, Veo et Imagen 3, sont désormais disponibles sur la plateforme Vertex AI, renforçant ainsi l'utilisation de l'IA dans le marketing et la publicité.

Veo, présenté pour la première fois lors de la conférence Google I/O pour les développeurs, est la réponse de Google DeepMind à des concurrents tels que Gen-3 de Runway et Sora d'OpenAI. Ce modèle peut transformer des invites textuelles ou imagées en vidéos de style cinématographique haute définition d'une durée allant jusqu'à 60 secondes, avec une cohérence exceptionnelle entre les images, garantissant un mouvement fluide du sujet dans le cadre.

Imagen 3, quant à lui, se concentre sur la génération d'images. Il est capable de générer des visuels photoréalistes à partir de texte, surpassant ses prédécesseurs en termes de détails, d'éclairage et de réduction des artéfacts. De plus, Imagen 3 intègre des fonctionnalités d'édition permettant aux utilisateurs d'optimiser les images générées via des invites textuelles, notamment l'amélioration, la réparation, le dessin extérieur et le remplacement d'arrière-plan, répondant ainsi aux besoins créatifs personnalisés.

En intégrant Veo et Imagen 3, Google Cloud offre aux équipes des secteurs du marketing et des ventes des outils de création plus puissants. Imagen 3 simplifie la création d'images produits de haute qualité et de contenu pour les médias sociaux, tandis que Veo transforme ces visuels en vidéos de qualité professionnelle, aidant les équipes à itérer rapidement leurs idées et à accélérer la production de contenu.

Warren Barkley, directeur principal de la gestion des produits chez Google, a déclaré que des clients comme Agoda utilisent les modèles d'IA Veo et Imagen pour réduire considérablement les délais de production des publicités vidéo et améliorer l'efficacité créative. De plus, Veo et Imagen 3 intègrent des fonctionnalités de sécurité telles que le filigrane numérique et la modération de contenu pour faire face aux risques liés à l'IA générative.

Ces innovations offrent aux entreprises du monde entier la possibilité de repenser la création et la diffusion de contenu visuel. Parmi les premiers utilisateurs figurent Mondelez International (marques Oreo, Cadbury, etc.) et le géant mondial du marketing WPP. Avec l'expansion continue des modèles de base de Google, les entreprises de tous les secteurs pourront utiliser plus efficacement l'IA pour stimuler l'innovation créative.

Le positionnement de Google dans le domaine de la génération de vidéos signifie une concurrence de plus en plus féroce. Faisant écho à Nova Reel, lancé par Amazon AWS lors de la conférence re:Invent, Veo de Google et Nova Reel établissent de nouvelles références dans le domaine de la génération de vidéos par IA. Nova Reel peut générer des vidéos de haute qualité de six secondes à partir d'invites textuelles et imagées, et est également disponible via la plateforme Amazon Bedrock.

Microsoft n'a pas encore lancé de modèle de génération de vidéos, bien que sa plateforme AI Foundry propose des outils de génération d'images. Le secteur s'attend à ce que Microsoft rattrape son retard dans ce domaine avec le lancement du modèle de génération de vidéos Sora d'OpenAI.

Adresse : https://cloud.google.com/blog/products/ai-machine-learning/introducing-veo-and-imagen-3-on-vertex-ai

Actualités IA

Google lance Veo et Imagen 3, des modèles de génération de vidéo et d'image révolutionnaires

AIbase基地

Recommandations d'actualités IA connexes

Les géants de l'IA, OpenAI et Google, achètent des vidéos inédites de créateurs, jusqu'à 4$ la minute