Florence-2-large

多様なビジョンおよびビジョン・言語タスクに対応する、高度なビジョン基礎モデルです。

一般製品画像ビジョンモデルマルチタスク学習
Florence-2-largeは、マイクロソフトが開発した高度なビジョン基礎モデルです。プロンプトベースのアプローチを採用し、幅広いビジョンおよびビジョン・言語タスクに対応します。このモデルは、シンプルなテキストプロンプトを解釈して、画像キャプション生成、物体検出、セグメンテーションなどのタスクを実行できます。5億4千万枚の画像に54億個の注釈が付いたFLD-5Bデータセットを活用し、マルチタスク学習に長けています。シーケンスツーシーケンスアーキテクチャにより、ゼロショットおよびファインチューニング設定の両方で優れたパフォーマンスを発揮し、競争力のあるビジョン基礎モデルであることが証明されています。
ウェブサイトを開く

Florence-2-large 最新のトラフィック状況

月間総訪問数

29742941

直帰率

44.20%

平均ページ/訪問

5.9

平均訪問時間

00:04:44

Florence-2-large 訪問数の傾向

Florence-2-large 訪問地理的分布

Florence-2-large トラフィックソース

Florence-2-large 代替品