YOLO-World

リアルタイムオープンボキャブラリー物体検出

一般製品画像リアルタイム物体検出
YOLO-Worldは、You Only Look Once (YOLO)シリーズの検出器をベースに、視覚言語モデルと大規模データセットによる事前学習によって、オープンボキャブラリー検出能力を強化した、高度なリアルタイムオープンボキャブラリー物体検出器です。再パラメータ化可能な視覚言語パスアグリゲーションネットワーク(RepVL-PAN)と領域テキストコントラスト損失を採用することで、視覚情報と言語情報の相互作用を促進しています。YOLO-Worldは、ゼロショット方式で様々な物体を効率的に検出し、高い効率性を備えています。チャレンジングなLVISデータセットにおいて、YOLO-WorldはV100上で35.4 APと52.0 FPSを実現し、精度と速度の両面で多くの最先端手法を凌駕しています。さらに、ファインチューニングされたYOLO-Worldは、物体検出やオープンボキャブラリーインスタンスセグメンテーションを含む、多くの下流タスクで優れた性能を発揮します。
ウェブサイトを開く

YOLO-World 最新のトラフィック状況

月間総訪問数

474564576

直帰率

36.20%

平均ページ/訪問

6.1

平均訪問時間

00:06:34

YOLO-World 訪問数の傾向

YOLO-World 訪問地理的分布

YOLO-World トラフィックソース

YOLO-World 代替品