研究人员最近开发了一种名为 REPA 的新技术,旨在加速 AI 图像生成模型的训练速度。REPA 代表 REPresentation Alignment,通过整合来自 DINOv2等模型的高质量视觉表示来提高训练速度和输出质量。

传统的扩散模型通常会创建嘈杂的图像,然后逐渐将其细化为干净的图像。REPA 增加了一个步骤,将在此去噪过程中生成的表示与来自 DINOv2的表示进行比较。然后,它将扩散模型的隐藏状态投影到 DINOv2的表示上。

QQ20241016-142502.png

研究人员表示,REPA 不仅提高了训练效率,还提高了生成的图像质量。使用各种扩散模型架构进行的测试显示出显着的改进:1. 训练时间减少了高达17.5倍2.输出图像质量无损失3.在标准图像质量指标上表现更佳

例如,使用 REPA 的 SiT-XL 模型仅用40万个训练步骤就实现了传统模型需要700万个步骤才能实现的目标。研究人员认为这是迈向更强大、更高效的 AI 图像生成系统的重要一步。

REPA 技术的出现为 AI 图像生成模型的训练速度和输出质量带来了新的希望。随着该技术的进一步发展和应用,我们可以期待看到更多的创新和突破。