FakeShield
बहु-मोडल बड़े भाषा मॉडल पर आधारित व्याख्यात्मक छवि पहचान और स्थिति निर्धारण
सामान्य उत्पादछविछवि पहचानबहु-मोडल अधिगम
FakeShield एक बहु-मोडल ढाँचा है जिसका उद्देश्य छवि पहचान और स्थिति निर्धारण (IFDL) के क्षेत्र में दो मुख्य चुनौतियों का समाधान करना है: पहचान सिद्धांत की ब्लैक बॉक्स प्रकृति और विभिन्न हेरफेर विधियों के बीच सीमित सामान्यीकरण क्षमता। FakeShield मौजूदा IFDL डेटासेट को GPT-4o का उपयोग करके बढ़ाकर बहु-मोडल हेरफेर विवरण डेटासेट (MMTD-Set) बनाता है, जिसका उपयोग FakeShield की हेरफेर विश्लेषण क्षमता को प्रशिक्षित करने के लिए किया जाता है। इस ढाँचे में डोमेन लेबल-निर्देशित व्याख्यात्मक पहचान मॉड्यूल (DTE-FDM) और स्थिति निर्धारण मॉड्यूल (MFLM) शामिल हैं, जो विभिन्न प्रकार की हेरफेर पहचान व्याख्याओं को संभाल सकते हैं और विस्तृत पाठ विवरण द्वारा निर्देशित स्थिति निर्धारण को प्राप्त कर सकते हैं। FakeShield अन्य विधियों की तुलना में पहचान सटीकता और F1 स्कोर में बेहतर प्रदर्शन करता है, जो एक व्याख्यात्मक और बेहतर समाधान प्रदान करता है।