Florence-2-large
Modelo base visual avanzado que admite múltiples tareas de visión y visión-lenguaje.
Producto ComúnImagenModelo visualAprendizaje multitarea
Florence-2-large es un modelo base visual avanzado desarrollado por Microsoft que utiliza un método basado en prompts para abordar una amplia gama de tareas de visión y visión-lenguaje. El modelo puede interpretar prompts de texto simples para realizar tareas como descripción de imágenes, detección y segmentación de objetos. Aprovecha el conjunto de datos FLD-5B, que contiene 540 millones de imágenes con 5.400 millones de anotaciones, y domina el aprendizaje multitarea. Su arquitectura de secuencia a secuencia le permite destacar tanto en entornos de cero-shot como de ajuste fino, demostrando ser un modelo base visual competitivo.
Florence-2-large Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44