VQAScore
Métricas e benchmark para avaliar a inovação na geração de imagens a partir de texto.
Produto ComumImagemGeração de textoGeração de imagens
O artigo *Evaluating Text-to-Visual Generation with Image-to-Text Generation* propõe uma nova métrica de avaliação, o VQAScore, capaz de avaliar melhor os resultados complexos da geração de imagens a partir de texto, e introduz o conjunto de benchmarks GenAI-Bench. O VQAScore, baseado no modelo CLIP-FlanT5, alcança o melhor desempenho na avaliação de geração de imagem, vídeo e 3D a partir de texto, sendo uma alternativa robusta ao CLIPScore. O GenAI-Bench oferece textos de cenários reais com combinações semânticas ricas, permitindo uma avaliação abrangente do desempenho dos modelos geradores.
VQAScore Situação do Tráfego Mais Recente
Total de Visitas Mensais
1515
Taxa de Rejeição
51.65%
Média de Páginas por Visita
1.1
Duração Média da Visita
00:00:05