Florence-2-large

Modelo base visual avanzado que admite múltiples tareas de visión y visión-lenguaje.

Producto ComúnImagenModelo visualAprendizaje multitarea
Florence-2-large es un modelo base visual avanzado desarrollado por Microsoft que utiliza un método basado en prompts para abordar una amplia gama de tareas de visión y visión-lenguaje. El modelo puede interpretar prompts de texto simples para realizar tareas como descripción de imágenes, detección y segmentación de objetos. Aprovecha el conjunto de datos FLD-5B, que contiene 540 millones de imágenes con 5.400 millones de anotaciones, y domina el aprendizaje multitarea. Su arquitectura de secuencia a secuencia le permite destacar tanto en entornos de cero-shot como de ajuste fino, demostrando ser un modelo base visual competitivo.
Abrir sitio web

Florence-2-large Situación del tráfico más reciente

Total de visitas mensuales

29742941

Tasa de rebote

44.20%

Páginas promedio por visita

5.9

Duración promedio de la visita

00:04:44

Florence-2-large Tendencia de visitas

Florence-2-large Distribución geográfica de las visitas

Florence-2-large Fuentes de tráfico

Florence-2-large Alternativas