YOLO-World
リアルタイムオープンボキャブラリー物体検出
一般製品画像リアルタイム物体検出
YOLO-Worldは、You Only Look Once (YOLO)シリーズの検出器をベースに、視覚言語モデルと大規模データセットによる事前学習によって、オープンボキャブラリー検出能力を強化した、高度なリアルタイムオープンボキャブラリー物体検出器です。再パラメータ化可能な視覚言語パスアグリゲーションネットワーク(RepVL-PAN)と領域テキストコントラスト損失を採用することで、視覚情報と言語情報の相互作用を促進しています。YOLO-Worldは、ゼロショット方式で様々な物体を効率的に検出し、高い効率性を備えています。チャレンジングなLVISデータセットにおいて、YOLO-WorldはV100上で35.4 APと52.0 FPSを実現し、精度と速度の両面で多くの最先端手法を凌駕しています。さらに、ファインチューニングされたYOLO-Worldは、物体検出やオープンボキャブラリーインスタンスセグメンテーションを含む、多くの下流タスクで優れた性能を発揮します。
YOLO-World 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34