Florence-2-base-ft

高度洗練されたビジョン基礎モデルであり、多様なビジョンタスクとビジョン・言語タスクに対応します。

一般製品画像画像処理ビジョン・言語モデル
Florence-2は、マイクロソフトが開発した高度なビジョン基礎モデルです。プロンプトベースのアプローチを採用し、幅広いビジョンタスクとビジョン・言語タスクを処理します。このモデルは、シンプルなテキストプロンプトを解釈し、画像キャプション生成、物体検出、セグメンテーションなどのタスクを実行できます。54億件の注釈を含む1億2600万枚の画像からなるFLD-5Bデータセットを使用して学習されており、マルチタスク学習に長けています。シーケンスツーシーケンスアーキテクチャにより、ゼロショット設定とファインチューニング設定の両方で優れた性能を発揮し、競争力のあるビジョン基礎モデルであることを証明しています。
ウェブサイトを開く

Florence-2-base-ft 最新のトラフィック状況

月間総訪問数

29742941

直帰率

44.20%

平均ページ/訪問

5.9

平均訪問時間

00:04:44

Florence-2-base-ft 訪問数の傾向

Florence-2-base-ft 訪問地理的分布

Florence-2-base-ft トラフィックソース

Florence-2-base-ft 代替品