VQAScore
用于评估文本到视觉生成的创新性指标和基准测试
普通产品图像文本生成视觉生成
Evaluating Text-to-Visual Generation with Image-to-Text Generation提出了一种新的评估指标VQAScore,能够更好地评估复杂的文本到视觉生成效果,并引入了GenAI-Bench基准测试集。VQAScore基于CLIP-FlanT5模型,能够在文本到图像/视频/3D生成评估中取得最佳性能,是一种强大的替代CLIPScore的方案。GenAI-Bench则提供了包含丰富组合语义的实际场景测试文本,可用于全面评估生成模型的性能。
VQAScore 最新流量情况
月总访问量
4111
跳出率
54.99%
平均页面访问数
1.1
平均访问时长
00:00:02