YOLO-World
Echtzeit-Objektdetektion mit offenem Vokabular
Normales ProduktBildEchtzeitObjekterkennung
YOLO-World ist ein fortschrittlicher Echtzeit-Objektdetektor mit offenem Vokabular, der auf der YOLO-Serie (You Only Look Once) basiert und durch visuelle Sprachmodellierung und vortrainierte, umfangreiche Datensätze die Erkennungsfähigkeit für ein offenes Vokabular verbessert. Er verwendet ein neues, umparametrisierbares visuell-sprachliches Pfadaggregationsnetzwerk (RepVL-PAN) und einen Regions-Text-Kontrastverlust, um die Interaktion zwischen visuellen und sprachlichen Informationen zu fördern. YOLO-World detektiert effizient verschiedene Objekte im Zero-Shot-Verfahren und zeichnet sich durch hohe Effizienz aus. Auf dem anspruchsvollen LVIS-Datensatz erreicht YOLO-World auf einer V100 35,4 AP und 52,0 FPS und übertrifft viele aktuelle Methoden sowohl in Bezug auf Genauigkeit als auch Geschwindigkeit. Darüber hinaus zeigt das feinabgestimmte YOLO-World hervorragende Ergebnisse bei verschiedenen Downstream-Aufgaben, darunter Objekterkennung und Instanzsegmentierung mit offenem Vokabular.
YOLO-World Neueste Verkehrssituation
Monatliche Gesamtbesuche
474564576
Absprungrate
36.20%
Durchschnittliche Seiten pro Besuch
6.1
Durchschnittliche Besuchsdauer
00:06:34