Florence-2-large-ft
Modèle de base visuel avancé prenant en charge plusieurs tâches de vision et de vision-langage.
Produit OrdinaireImageTraitement d'imageTraitement du langage naturel
Florence-2-large-ft est un modèle de base visuel avancé développé par Microsoft, utilisant une approche basée sur des invites pour traiter un large éventail de tâches de vision et de vision-langage. Ce modèle est capable d'exécuter des tâches telles que la description d'image, la détection d'objets et la segmentation via de simples invites textuelles. Il exploite l'ensemble de données FLD-5B, comprenant 5,4 milliards d'annotations couvrant 126 millions d'images, pour réaliser un apprentissage multitâche. L'architecture séquence-à-séquence du modèle lui permet d'obtenir d'excellents résultats, aussi bien en zéro-shot qu'en réglage fin, prouvant ainsi qu'il s'agit d'un modèle de base visuel compétitif.
Florence-2-large-ft Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44