DragNUWA é um modelo de geração de vídeo baseado em algoritmos de difusão, projetado para resolver o problema de controle preciso na geração de vídeo. O modelo introduz informações de texto, imagem e trajetória, fornecendo controle preciso de perspectivas semântica, espacial e temporal. Experimentos demonstram que o modelo DragNUWA apresenta excelente desempenho em termos de controle preciso na geração de vídeo.