GLIGEN
开放式基于提示的图像生成
普通产品图像计算机视觉深度学习
GLIGEN是一个开放式的基于文本提示的图像生成模型,它可以基于文本描述和边界框等限定条件生成图像。该模型通过冻结预训练好的文本到图像Diffusion模型的参数,并在其中插入新的数据来实现。这种模块化设计可以高效地进行训练,并具有很强的推理灵活性。GLIGEN可以支持开放世界的有条件图像生成,对新出现的概念和布局也具有很强的泛化能力。
GLIGEN 最新流量情况
月总访问量
2645
跳出率
55.59%
平均页面访问数
1.3
平均访问时长
00:00:54