Florence-2-large-ft

Modèle de base visuel avancé prenant en charge plusieurs tâches de vision et de vision-langage.

Produit OrdinaireImageTraitement d'imageTraitement du langage naturel
Florence-2-large-ft est un modèle de base visuel avancé développé par Microsoft, utilisant une approche basée sur des invites pour traiter un large éventail de tâches de vision et de vision-langage. Ce modèle est capable d'exécuter des tâches telles que la description d'image, la détection d'objets et la segmentation via de simples invites textuelles. Il exploite l'ensemble de données FLD-5B, comprenant 5,4 milliards d'annotations couvrant 126 millions d'images, pour réaliser un apprentissage multitâche. L'architecture séquence-à-séquence du modèle lui permet d'obtenir d'excellents résultats, aussi bien en zéro-shot qu'en réglage fin, prouvant ainsi qu'il s'agit d'un modèle de base visuel compétitif.
Ouvrir le site Web

Florence-2-large-ft Dernière situation du trafic

Nombre total de visites mensuelles

29742941

Taux de rebond

44.20%

Nombre moyen de pages par visite

5.9

Durée moyenne de la visite

00:04:44

Florence-2-large-ft Tendance des visites

Florence-2-large-ft Distribution géographique des visites

Florence-2-large-ft Sources de trafic

Florence-2-large-ft Alternatives