SPRIGHT
提高文本到图像模型中空间一致性的解决方案
普通产品图像文本到图像空间一致性
SPRIGHT是一个专注于空间关系的大规模视觉语言数据集和模型。它通过重新描述600万张图像构建了SPRIGHT数据集,显著增加了描述中的空间短语。该模型在444张包含大量物体的图像上进行微调训练,从而优化生成具有空间关系的图像。SPRIGHT在多个基准测试中实现了空间一致性的最新水平,同时提高了图像质量评分。
SPRIGHT 最新流量情况
月总访问量
939
跳出率
56.39%
平均页面访问数
1.0
平均访问时长
00:00:00