FakeShield

Erklärbares Bilddetektor- und Lokalisierungsmodell auf Basis multimodaler, großer Sprachmodelle

Normales ProduktBildBilderkennungMultimodales Lernen
FakeShield ist ein multimodales Framework, das darauf abzielt, zwei Hauptprobleme im Bereich der Bilddetektor- und Lokalisierung (IFDL) zu lösen: die Black-Box-Natur der Detektionsmethodik und die begrenzte Generalisierungsfähigkeit über verschiedene Fälschungstechniken hinweg. FakeShield nutzt GPT-4, um vorhandene IFDL-Datensätze zu erweitern und einen multimodalen Datensatz mit Fälschungsbeschreibungen (MMTD-Set) zu erstellen, der das Modell im Fälschungsanalyse-Bereich trainiert. Das Framework umfasst ein domänenbezeichnungsgesteuertes, erklärbares Detektionsmodul (DTE-FDM) und ein Lokalisierungsmodul (MFLM), die verschiedene Arten von Fälschungsdetektionserklärungen verarbeiten und eine positionsgenaue Lokalisierung basierend auf detaillierten Textbeschreibungen ermöglichen. FakeShield übertrifft andere Methoden in Bezug auf Detektionsgenauigkeit und F1-Score und bietet eine erklärbare und überlegene Lösung.
Website öffnen

FakeShield Alternativen