PixelProse

Conjunto de dados de descrição de imagens em larga escala, fornecendo mais de 16 milhões de descrições de imagens sintéticas.

Produto ComumOutrosDescrição de imagemModelo de visão linguística
PixelProse é um conjunto de dados em larga escala criado pelo tomg-group-umd, que utiliza o modelo avançado de visão linguística Gemini 1.0 Pro Vision para gerar mais de 16 milhões de descrições de imagens detalhadas. Este conjunto de dados é de grande importância para o desenvolvimento e aprimoramento de tecnologias de conversão de imagem para texto, podendo ser usado em tarefas como geração de descrição de imagens e perguntas e respostas visuais.
Abrir Site

PixelProse Situação do Tráfego Mais Recente

Total de Visitas Mensais

29742941

Taxa de Rejeição

44.20%

Média de Páginas por Visita

5.9

Duração Média da Visita

00:04:44

PixelProse Tendência de Visitas

PixelProse Distribuição Geográfica das Visitas

PixelProse Fontes de Tráfego

PixelProse Alternativas