DragNUWA es un modelo de generación de video basado en algoritmos de difusión, diseñado para abordar el problema del control preciso en la generación de video. Este modelo introduce información de texto, imagen y trayectoria, ofreciendo un control preciso desde perspectivas semántica, espacial y temporal. Los experimentos demuestran que el modelo DragNUWA destaca en el control preciso de la generación de video.