Google ha lanzado oficialmente su modelo de generación de video de última generación, Veo2, con el objetivo de competir con Sora de OpenAI. Google afirma que Veo2 muestra una mayor realidad y delicadeza en la generación de videos. Esta actualización no solo mejora la calidad del video, sino que también refuerza la comprensión de la física real y los matices del movimiento y las expresiones humanas.

image.png

Las poderosas funciones de Veo2

Google afirma que Veo2 "tiene una mejor comprensión de la física del mundo real y los matices del movimiento y las expresiones humanas". Se puede utilizar en la plataforma VideoFX de Google Labs, pero solo mediante lista de espera. Los usuarios deben registrarse a través de un formulario de Google y esperar a que Google les otorgue acceso temporal en el momento que ellos elijan.

Google indica que los usuarios pueden seleccionar el tipo de video, las tomas y los efectos cinematográficos según sus necesidades. Veo2 podrá generar videos con una resolución de hasta 4K.

En comparación, la versión original de Veo sigue estando disponible en Vertex AI, y los videos generados por Veo2 incluirán la marca de agua de metadatos SynthID de Google para identificarlos como contenido generado por IA.

A pesar de los avances tecnológicos de Veo2, Google reconoce que el modelo ocasionalmente puede sufrir "alucinaciones", como generar dedos adicionales, aunque en general, la aparición de estas alucinaciones se ha reducido en la nueva versión.

Google afirma que, en sus pruebas internas, los evaluadores humanos prefirieron Veo a Sora y otros modelos de inteligencia artificial de la competencia al medir las "preferencias generales" (es decir, qué videos preferían los espectadores) y el "cumplimiento puntual" (el grado de coincidencia del video con las instrucciones proporcionadas por los creadores humanos).

Acceso a la experiencia Veo2: https://labs.google/fx/tools/video-fx

Acceso a la información: https://deepmind.google/technologies/veo/veo-2/

La generación de video con IA aún requiere esfuerzo

A pesar de los continuos avances en la tecnología de generación de video con IA, la competencia entre grandes empresas como Google y OpenAI sigue siendo feroz. Otras empresas más pequeñas, como RunwayML y Luma AI, también están lanzando continuamente nuevas funciones para mejorar sus capacidades de generación de video.

Recientemente, RunwayML lanzó funciones de control avanzadas para el modelo Gen-3Alpha Turbo, mientras que Pika Labs lanzó Pika2.0, que permite a los usuarios agregar sus propios personajes a los videos.

Sin embargo, la confianza de los usuarios en los videos generados por IA sigue siendo baja. El lanzamiento de Sora no ha disipado por completo las dudas, y algunos usuarios han informado de resultados que contradicen las leyes de la física y la anatomía. Además, en una reciente gala de premios de videojuegos, los espectadores expresaron su descontento con el "caos de la IA" en el contenido generado por IA.

Google afirma que muchos usuarios han mostrado un gran interés en Veo2, especialmente algunos creadores de YouTube que ya están utilizando VideoFX para crear fondos para sus videos cortos y ahorrar tiempo.

Actualización de Imagen3 

Además de Veo2, Google también ha actualizado su modelo de generación de imágenes Imagen3, mejorando aún más el realismo y la viveza de los colores de las imágenes generadas. La nueva versión de Imagen3 puede representar con mayor precisión una variedad de estilos artísticos, desde el fotorrealismo hasta el impresionismo, pasando por el arte abstracto y el anime. Al mismo tiempo, el modelo ha mejorado en el seguimiento de las instrucciones del usuario.

Puntos clave:

- 🎥 Google lanza el modelo de generación de video Veo2, afirmando que su calidad de video supera a la de Sora de OpenAI.

- 🚀 Los usuarios pueden solicitar el uso de Veo2 a través de un formulario de Google, pudiendo seleccionar el estilo y los efectos al generar videos.

- 🎨 El modelo de generación de imágenes Imagen3 actualizado representa mejor diversos estilos artísticos, ofreciendo una mejor experiencia al usuario.