YOLO-World

Echtzeit-Objektdetektion mit offenem Vokabular

Normales ProduktBildEchtzeitObjekterkennung
YOLO-World ist ein fortschrittlicher Echtzeit-Objektdetektor mit offenem Vokabular, der auf der YOLO-Serie (You Only Look Once) basiert und durch visuelle Sprachmodellierung und vortrainierte, umfangreiche Datensätze die Erkennungsfähigkeit für ein offenes Vokabular verbessert. Er verwendet ein neues, umparametrisierbares visuell-sprachliches Pfadaggregationsnetzwerk (RepVL-PAN) und einen Regions-Text-Kontrastverlust, um die Interaktion zwischen visuellen und sprachlichen Informationen zu fördern. YOLO-World detektiert effizient verschiedene Objekte im Zero-Shot-Verfahren und zeichnet sich durch hohe Effizienz aus. Auf dem anspruchsvollen LVIS-Datensatz erreicht YOLO-World auf einer V100 35,4 AP und 52,0 FPS und übertrifft viele aktuelle Methoden sowohl in Bezug auf Genauigkeit als auch Geschwindigkeit. Darüber hinaus zeigt das feinabgestimmte YOLO-World hervorragende Ergebnisse bei verschiedenen Downstream-Aufgaben, darunter Objekterkennung und Instanzsegmentierung mit offenem Vokabular.
Website öffnen

YOLO-World Neueste Verkehrssituation

Monatliche Gesamtbesuche

474564576

Absprungrate

36.20%

Durchschnittliche Seiten pro Besuch

6.1

Durchschnittliche Besuchsdauer

00:06:34

YOLO-World Besuchstrend

YOLO-World Geografische Verteilung der Besuche

YOLO-World Traffic-Quellen

YOLO-World Alternativen