YOLO-World
Détection d'objets en temps réel avec vocabulaire ouvert
Produit OrdinaireImageTemps réelDétection d'objets
YOLO-World est un détecteur d'objets en temps réel avancé à vocabulaire ouvert, basé sur la série de détecteurs You Only Look Once (YOLO). Il améliore les capacités de détection à vocabulaire ouvert grâce à la modélisation vision-langage et à un pré-entraînement sur un ensemble de données à grande échelle. Il utilise un nouveau réseau d'agrégation de chemins vision-langage reparamétrable (RepVL-PAN) et une perte de contraste région-texte, favorisant l'interaction entre les informations visuelles et linguistiques. YOLO-World détecte efficacement divers objets en mode zéro-shot, avec une grande efficacité. Sur l'ensemble de données LVIS, YOLO-World atteint 35,4 AP et 52,0 FPS sur une V100, surpassant de nombreuses méthodes récentes en termes de précision et de vitesse. De plus, YOLO-World, après réglage fin, excelle dans plusieurs tâches en aval, notamment la détection d'objets et la segmentation d'instances à vocabulaire ouvert.
YOLO-World Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34