PixelProse
Conjunto de dados de descrição de imagens em larga escala, fornecendo mais de 16 milhões de descrições de imagens sintéticas.
Produto ComumOutrosDescrição de imagemModelo de visão linguística
PixelProse é um conjunto de dados em larga escala criado pelo tomg-group-umd, que utiliza o modelo avançado de visão linguística Gemini 1.0 Pro Vision para gerar mais de 16 milhões de descrições de imagens detalhadas. Este conjunto de dados é de grande importância para o desenvolvimento e aprimoramento de tecnologias de conversão de imagem para texto, podendo ser usado em tarefas como geração de descrição de imagens e perguntas e respostas visuais.
PixelProse Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44