VQAScore

用于评估文本到视觉生成的创新性指标和基准测试

普通产品图像文本生成视觉生成
Evaluating Text-to-Visual Generation with Image-to-Text Generation提出了一种新的评估指标VQAScore,能够更好地评估复杂的文本到视觉生成效果,并引入了GenAI-Bench基准测试集。VQAScore基于CLIP-FlanT5模型,能够在文本到图像/视频/3D生成评估中取得最佳性能,是一种强大的替代CLIPScore的方案。GenAI-Bench则提供了包含丰富组合语义的实际场景测试文本,可用于全面评估生成模型的性能。
打开网站

VQAScore 最新流量情况

月总访问量

2146

跳出率

61.50%

平均页面访问数

1.0

平均访问时长

00:00:00

VQAScore 访问量趋势

VQAScore 访问地理位置分布

VQAScore 流量来源

VQAScore 替代品