Florence-2-base-ft
Modelo base visual avanzado, compatible con diversas tareas de visión y visión-lenguaje.
Producto ComúnImagenProcesamiento de imágenesModelo de visión-lenguaje
Florence-2 es un modelo base visual avanzado desarrollado por Microsoft, que utiliza un método basado en indicaciones para abordar una amplia gama de tareas de visión y visión-lenguaje. El modelo puede interpretar indicaciones de texto sencillas y realizar tareas como descripción de imágenes, detección y segmentación de objetos. Aprovecha el conjunto de datos FLD-5B, que contiene 5.400 millones de anotaciones y abarca 126 millones de imágenes, siendo experto en aprendizaje multitarea. Su arquitectura de secuencia a secuencia le permite destacar tanto en entornos de cero disparos como en ajustes de ajuste fino, demostrando ser un modelo base visual competitivo.
Florence-2-base-ft Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44