Florence-2-large

Modèle de base visuel avancé, prenant en charge plusieurs tâches visuelles et visuelles-linguistiques.

Produit OrdinaireImageModèle visuelApprentissage multitâche
Florence-2-large est un modèle de base visuel avancé développé par Microsoft, utilisant une approche basée sur les invites pour traiter un large éventail de tâches visuelles et visuelles-linguistiques. Ce modèle est capable d'interpréter des invites textuelles simples pour effectuer des tâches telles que la description d'images, la détection d'objets et la segmentation. Il utilise l'ensemble de données FLD-5B, contenant 540 millions d'images avec 5,4 milliards d'annotations, et maîtrise l'apprentissage multitâche. Son architecture séquence-à-séquence lui permet d'obtenir d'excellents résultats en zéro-shot et en réglage fin, prouvant qu'il s'agit d'un modèle de base visuel compétitif.
Ouvrir le site Web

Florence-2-large Dernière situation du trafic

Nombre total de visites mensuelles

29742941

Taux de rebond

44.20%

Nombre moyen de pages par visite

5.9

Durée moyenne de la visite

00:04:44

Florence-2-large Tendance des visites

Florence-2-large Distribution géographique des visites

Florence-2-large Sources de trafic

Florence-2-large Alternatives