ViewDiff
基于预训练的文本到图像模型生成高质量、多视角一致的3D物体图像。
普通产品图像3D重建图像生成
ViewDiff 是一种利用预训练的文本到图像模型作为先验知识,从真实世界数据中学习生成多视角一致的图像的方法。它在U-Net网络中加入了3D体积渲染和跨帧注意力层,能够在单个去噪过程中生成3D一致的图像。与现有方法相比,ViewDiff生成的结果具有更好的视觉质量和3D一致性。
ViewDiff 最新流量情况
月总访问量
3232
跳出率
54.66%
平均页面访问数
1.2
平均访问时长
00:00:16