Florence-2-large-ft
Ein fortschrittliches visuelles Basismodell, das verschiedene visuelle und visuell-linguistische Aufgaben unterstützt.
Normales ProduktBildBildverarbeitungNatürliche Sprachverarbeitung
Florence-2-large-ft ist ein von Microsoft entwickeltes hochentwickeltes visuelles Basismodell, das mit einer promptbasierten Methode eine breite Palette an visuellen und visuell-linguistischen Aufgaben bewältigt. Das Modell kann Aufgaben wie Bildbeschreibung, Objekterkennung und -segmentierung mithilfe einfacher Textprompts ausführen. Es nutzt den FLD-5B-Datensatz mit 5,4 Milliarden annotierten Bildern, die 126 Millionen Bilder umfassen, um Multi-Task-Lernen zu ermöglichen. Die Sequenz-zu-Sequenz-Architektur des Modells führt sowohl in Zero-Shot- als auch in Fine-Tuning-Einstellungen zu hervorragenden Ergebnissen und zeigt, dass es ein wettbewerbsfähiges visuelles Basismodell ist.
Florence-2-large-ft Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44