OpenAI最近公布了一项名为sCM(简化型、稳定型和可扩展型一致性模型)的突破性技术,这一创新彻底改变了AI图像模型的训练方式。该技术在原有的一致性模型(CMs)基础上实现了重大突破,为快速图像生成开辟了新天地。

技术核心优势:

只需两步计算即可生成高质量图像

在A100GPU上生成一张图片仅需0.11秒

相比传统扩散模型,速度提升50倍

最大模型参数达15亿,创下新纪录

image.png

在实际测试中,sCM的表现令人瞩目。在CIFAR-10数据集上获得了2.06的FID评分,在ImageNet上生成512x512像素图像时达到了1.88的优异成绩。这些指标仅比现有最佳扩散模型落后约10%,但速度却有质的飞跃。

技术革新的关键在于解决了传统一致性模型的根本性问题。此前的模型使用离散时间步长,不仅需要额外参数,还容易出错。OpenAI的研究团队通过建立简化的理论框架,统一了各种方法,成功识别并解决了训练不稳定的主要原因。

更令人期待的是,这项技术展现出强大的扩展潜力。OpenAI成功在ImageNet数据集上训练了参数量达15亿的模型,这在同类模型中尚属首次。研究发现,随着模型规模增大,图像质量持续提升,这意味着未来可能实现更大规模的模型训练。