Florence-2-base-ft
Modelo básico de visão avançado, suporta diversas tarefas de visão e visão-linguagem.
Produto ComumImagemProcessamento de ImagensModelo de Visão-Linguagem
Florence-2 é um modelo básico de visão avançado desenvolvido pela Microsoft, que utiliza um método baseado em prompts para lidar com uma ampla gama de tarefas de visão e visão-linguagem. O modelo consegue interpretar prompts de texto simples e executar tarefas como descrição de imagens, detecção de objetos e segmentação. Ele utiliza o conjunto de dados FLD-5B, contendo 5,4 bilhões de anotações cobrindo 126 milhões de imagens, e domina o aprendizado de múltiplas tarefas. Sua arquitetura sequencial permite um desempenho excelente em configurações de zero-shot e fine-tuning, provando ser um modelo básico de visão competitivo.
Florence-2-base-ft Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44