PixelProse

Conjunto de datos de descripción de imágenes a gran escala, que proporciona más de 16 millones de descripciones de imágenes sintéticas.

Producto ComúnOtrosDescripción de imágenesModelo de lenguaje visual
PixelProse es un conjunto de datos a gran escala creado por tomg-group-umd que utiliza el modelo de visión de lenguaje visual avanzado Gemini 1.0 Pro Vision para generar más de 16 millones de descripciones de imágenes detalladas. Este conjunto de datos es de gran importancia para el desarrollo y la mejora de las técnicas de conversión de imagen a texto, y se puede utilizar en tareas como la generación de descripciones de imágenes y las preguntas y respuestas visuales.
Abrir sitio web

PixelProse Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

PixelProse Tendencia de visitas

PixelProse Distribución geográfica de las visitas

PixelProse Fuentes de tráfico

PixelProse Alternativas