Florence-2-base-ft
高度洗練されたビジョン基礎モデルであり、多様なビジョンタスクとビジョン・言語タスクに対応します。
一般製品画像画像処理ビジョン・言語モデル
Florence-2は、マイクロソフトが開発した高度なビジョン基礎モデルです。プロンプトベースのアプローチを採用し、幅広いビジョンタスクとビジョン・言語タスクを処理します。このモデルは、シンプルなテキストプロンプトを解釈し、画像キャプション生成、物体検出、セグメンテーションなどのタスクを実行できます。54億件の注釈を含む1億2600万枚の画像からなるFLD-5Bデータセットを使用して学習されており、マルチタスク学習に長けています。シーケンスツーシーケンスアーキテクチャにより、ゼロショット設定とファインチューニング設定の両方で優れた性能を発揮し、競争力のあるビジョン基礎モデルであることを証明しています。
Florence-2-base-ft 最新のトラフィック状況
月間総訪問数
29742941
直帰率
44.20%
平均ページ/訪問
5.9
平均訪問時間
00:04:44