PixelProse
Conjunto de datos de descripción de imágenes a gran escala, que proporciona más de 16 millones de descripciones de imágenes sintéticas.
Producto ComúnOtrosDescripción de imágenesModelo de lenguaje visual
PixelProse es un conjunto de datos a gran escala creado por tomg-group-umd que utiliza el modelo de visión de lenguaje visual avanzado Gemini 1.0 Pro Vision para generar más de 16 millones de descripciones de imágenes detalladas. Este conjunto de datos es de gran importancia para el desarrollo y la mejora de las técnicas de conversión de imagen a texto, y se puede utilizar en tareas como la generación de descripciones de imágenes y las preguntas y respuestas visuales.
PixelProse Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44