Florence-2-large
Modèle de base visuel avancé, prenant en charge plusieurs tâches visuelles et visuelles-linguistiques.
Produit OrdinaireImageModèle visuelApprentissage multitâche
Florence-2-large est un modèle de base visuel avancé développé par Microsoft, utilisant une approche basée sur les invites pour traiter un large éventail de tâches visuelles et visuelles-linguistiques. Ce modèle est capable d'interpréter des invites textuelles simples pour effectuer des tâches telles que la description d'images, la détection d'objets et la segmentation. Il utilise l'ensemble de données FLD-5B, contenant 540 millions d'images avec 5,4 milliards d'annotations, et maîtrise l'apprentissage multitâche. Son architecture séquence-à-séquence lui permet d'obtenir d'excellents résultats en zéro-shot et en réglage fin, prouvant qu'il s'agit d'un modèle de base visuel compétitif.
Florence-2-large Dernière situation du trafic
Nombre total de visites mensuelles
29742941
Taux de rebond
44.20%
Nombre moyen de pages par visite
5.9
Durée moyenne de la visite
00:04:44