¿Recuerdas los impresionantes efectos especiales de las películas? ¿Objetos desapareciendo de la nada, escenas cambiando instantáneamente? ¡Impresionante, verdad? Ahora, el equipo de Google DeepMind ha desarrollado un modelo de IA llamado "Generative Omnimatte" que hace que estos efectos especiales ya no sean exclusivos del cine. Esta IA es como un editor experto, capaz de descomponer un video en varias capas, cada una conteniendo un objeto completo con sus sombras, reflejos y demás efectos.

image.png

Las técnicas tradicionales de recorte de video suelen depender de la grabación con pantalla verde o de información de profundidad precisa, lo que resulta muy complejo. Este modelo de IA elimina por completo estas limitaciones; no necesita información adicional para separar perfectamente a las personas, objetos y fondos de un video, incluso puede "imaginar" las partes ocultas, ¡con resultados asombrosos!

El núcleo de este modelo de IA es un modelo de eliminación de video llamado "Casper". Es como una goma mágica que puede borrar con precisión cualquier objeto que se especifique en un video, incluyendo sus sombras y reflejos, dejando el fondo intacto.

Más importante aún, puede recombinar objetos y fondos según las necesidades del usuario, permitiendo crear efectos creativos, como "teletransportar" a una persona de una escena a otra, cambiar la velocidad de movimiento de un objeto, ¡o incluso invertir el tiempo!

Con esta herramienta, la edición de video será mucho más fácil. Podrás añadir cualquier efecto especial sin preocuparte por problemas técnicos. ¡Cualquiera puede convertirse en un maestro de la edición! Por ejemplo, si quieres "teletransportar" a un amigo de su casa a la playa, solo necesitas recortarlo con Casper y colocarlo en un fondo de playa. ¡Sencillo, ¿verdad? Incluso puedes hacer que tu amigo camine al revés en el video o crear varias copias de él bailando juntas. ¡Solo imagina las posibilidades!

Por supuesto, Generative Omnimatte aún está en fase de desarrollo y hay algunos pequeños errores que solucionar. Por ejemplo, si hay varios objetos muy similares en el video, la IA podría confundirlos. Además, si un objeto cambia de forma, como una barra doblada, la IA no sabe cómo procesarlo. Pero confiamos en que el equipo de Google DeepMind resolverá estos problemas pronto para que Generative Omnimatte sea aún más perfecto.

Dirección del proyecto: https://gen-omnimatte.github.io/

Dirección del artículo: https://arxiv.org/pdf/2411.16683