苹果研究人员近日提出了俄罗斯套娃式扩散模型MDM,可以端到端生成1024x1024分辨率的高质量图像。MDM的创新在于引入了多分辨率扩散过程,通过嵌套UNet架构实现了多分辨率损失,大大提高了高分辨率输入去噪的收敛速度。另外,MDM还使用了渐进式训练,从低分辨率开始训练,逐步添加高分辨率输入和输出,极大地提高了训练效率。尽管训练数据集较小,但MDM展现出了生成高质量高分辨率图像和视频的强大能力。相比其他级联或潜在方法,MDM训练和推理更简单高效。