¡Viaja a través del río Qingming! DragNUWA hace una aparición sorprendente: arrastra y suelta para convertir imágenes estáticas en videos en segundos

新智元

Publicado elNoticias de IA · 2 minutos de lectura · Sep 6, 2023

DragNUWA: Modelo de Generación de Video de Microsoft

El modelo de generación de video DragNUWA, desarrollado por Microsoft, permite animar imágenes estáticas. Genera videos coherentes a través de la creación de trayectorias de movimiento mediante arrastre.

Este modelo admite el control simultáneo del movimiento de la cámara y de múltiples objetos, así como trayectorias complejas, generando videos con características de escenas del mundo real y pinturas artísticas. DragNUWA incorpora información de texto, imágenes y trayectorias para un control preciso del contenido del video desde una perspectiva semántica, espacial y temporal.

Los investigadores probaron el modelo en cuanto al movimiento de la cámara y trayectorias complejas, demostrando su capacidad para modelar y controlar con precisión movimientos complejos.

El proceso de entrenamiento del modelo incluye un muestreador de trayectorias, fusión multiescala y entrenamiento adaptativo. DragNUWA se entrenó utilizando los conjuntos de datos WebVid y VideoHD.

El modelo tiene un amplio potencial de aplicación en áreas como la producción de video y la creación de animaciones.

Generación de video Procesamiento de imágenes Control de trayectoria

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

Pixverse lanza MCP: Desbloquea un nuevo nivel en la generación de video con IA

Con el rápido desarrollo de la tecnología de IA generativa, el campo de la creación de videos está experimentando una nueva ola de transformación. Pixverse, una plataforma líder en la generación de videos con IA, ha lanzado recientemente el Model Context Protocol (MCP), ofreciendo a usuarios y desarrolladores una solución de generación de video más eficiente y flexible. ¿Qué es MCP? Desbloquea una nueva forma de generar videos con IAPixverse's MCP (Model Context Protocol) es un protocolo específicamente diseñado para la generación de videos con IA

Apr 25, 2025

¡Revolucionando la creación de videos! El modelo VACE de Alibaba procesa de forma unificada entradas de texto, imágenes y video

Los científicos de Alibaba Group han presentado VACE, un modelo de inteligencia artificial generalizado diseñado para procesar de forma unificada una amplia gama de tareas de generación y edición de video. El núcleo de VACE es una arquitectura de transformador de difusión mejorada, cuya innovación radica en un nuevo formato de entrada llamado "unidad de condición de video" (VCU). La VCU destila múltiples modalidades de entrada, como indicaciones de texto, imágenes o secuencias de video de referencia y máscaras espaciales, en una representación unificada, y coordina las diferentes entradas a través de un mecanismo especializado para evitar conflictos. El desacoplamiento conceptual permite un control preciso.

Apr 23, 2025

MAGI-1, el primer gran modelo de generación de video autorregresivo a nivel mundial, se lanza oficialmente; el equipo de Swin Transformer lidera una nueva tendencia en la creación de video

En el campo de la generación de video, ha surgido un nuevo competidor poderoso: MAGI-1. Este gran modelo de generación de video autorregresivo, desarrollado por Sand AI, una empresa fundada por Cao Yue, ganador del premio Marl y del premio especial de Tsinghua, está redefiniendo las posibilidades de la creación de video. MAGI-1 genera videos prediciendo secuencias de bloques de video, y ha generado un amplio interés debido a sus resultados naturales y fluidos y a sus múltiples versiones descargables. MAGI-1 posee numerosas ventajas al generar videos. En primer lugar, ofrece una experiencia de video fluida e ininterrumpida, capaz de generar...

Apr 22, 2025

Ranking de las 20 principales empresas de generación de video con IA en 2025: Keling AI, Dream AI y PixVerse AI ocupan los tres primeros puestos

Recientemente, la lista de las "20 principales empresas de generación de video con IA en 2025", publicada conjuntamente por DBC, CIW y CIS, se ha hecho pública. Keling AI (de Kuaishou), PixVerse AI (de iFLYTEK) y Dream AI (de Douyin) ocupan los tres primeros puestos. Además, varias empresas como Alibaba (Tongyi Wanxiang, Huiwa AI Video), Tencent (ZHIYING), iFLYTEK (Xunfei Huijing), MiniMax (Haile AI), etc., también aparecen en la lista.

Apr 22, 2025

Alibaba lanza Wan2.1-FLF2V-14B: Un gran avance en la generación de video HD de 720p a partir de fotogramas inicial y final

Alibaba ha presentado Wan2.1-FLF2V-14B, un nuevo modelo de inteligencia artificial que permite generar videos HD de 720p a partir de solo dos fotogramas: el inicial y el final. Este avance representa un significativo salto en la tecnología de generación de video, abriendo nuevas posibilidades en la creación de contenido y la edición de video.

Apr 18, 2025

ByteDance lanza el modelo de video Seaweed-7B: la generación de video con IA alcanza nuevas alturas

El campo de la generación de video con inteligencia artificial alcanza un nuevo hito. AIbase ha sabido a través de las redes sociales que ByteDance ha publicado recientemente el artículo y la demostración de su nuevo modelo de generación de video Seaweed-7B, mostrando una serie de funciones innovadoras, incluyendo la generación sincronizada de audio y video, la narración de escenas largas y la generación en tiempo real de alta resolución. Este lanzamiento marca una aceleración en la estrategia de ByteDance en tecnología de video con IA. A continuación, AIbase presenta un informe en profundidad sobre Seaweed-7B, analizando sus puntos fuertes tecnológicos y su impacto en la industria. Seaweed-7B impresionante

Apr 15, 2025

El laboratorio Alibaba Tongyi lanza un nuevo modelo de generación de humanos digitales ¡Síntesis de audio y video más realista!

El laboratorio Alibaba Tongyi lanzó recientemente un nuevo modelo de generación de video de humanos digitales llamado "OmniTalker". El núcleo de este innovador modelo radica en su capacidad para imitar con precisión las expresiones faciales, la voz y el estilo de habla de una persona en un video simplemente cargando un video de referencia. En comparación con los procesos tradicionales de creación de humanos digitales, OmniTalker reduce significativamente los costos de producción y, al mismo tiempo, mejora el realismo y la experiencia interactiva del contenido generado, satisfaciendo una amplia gama de necesidades de aplicación. OmniTalker es muy fácil de usar; los usuarios solo...

Apr 15, 2025

Google lanza Vertex AI Media Studio, un kit de generación de videos a partir de texto que revoluciona el proceso de creación de videos

El 9 de abril de 2025, Google anunció oficialmente el lanzamiento de Vertex AI Media Studio, un kit de generación de videos a partir de texto. Esta nueva plataforma tiene como objetivo simplificar enormemente el proceso de creación de contenido de video mediante el uso de tecnología de inteligencia artificial, ofreciendo a los usuarios una solución integral que va desde el texto hasta el video completo. Esta noticia ha generado un gran interés en la comunidad tecnológica y entre los creadores de contenido. Generación de contenido de video automatizado de principio a fin. Vertex AI Media Studio integra varios modelos de IA de vanguardia de Google, incluyendo I

Apr 10, 2025

460

Veo 2 llega con fuerza a la API de Gemini: la revolución de la generación de video con IA comienza

Recientemente, el equipo de inteligencia artificial de Google anunció que su aclamado modelo de generación de video, Veo2, está oficialmente disponible para los desarrolladores a través de la API de Gemini. Esta noticia ha generado un gran revuelo en el mundo de la tecnología, marcando una nueva era en la tecnología de generación de video con IA. A partir de hoy, todos los desarrolladores que habiliten la función de facturación y alcancen el nivel Tier 1 o superior podrán usar la API para acceder a Veo2 y experimentar sus potentes funciones de texto a video (Text-to-Video) e imagen a video (Image-to-Video).

Apr 10, 2025

130

Tecnología de generación de video con IA TTT: Crea videos animados de Tom y Jerry de un minuto sin edición ni empalmes

Recientemente, se publicó un nuevo artículo de investigación titulado "Generación de video de un minuto con entrenamiento en tiempo de prueba" (One-Minute Video Generation with Test-Time Training), que marca una nueva etapa en la tecnología de generación de video con inteligencia artificial. Esta investigación, mediante la introducción de una innovadora capa de entrenamiento en tiempo de prueba (TTT) en un modelo Transformer preentrenado, ha logrado generar con éxito un minuto de animación de "Tom y Jerry" (Tom and Jerry)

Apr 9, 2025

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General