GenSAM
Eine universelle Textprompt-Methode zur Segmentierung von Tarnzielen.
Normales ProduktBildBildverarbeitungBildgenerierung
GenSAM ist eine Methode zur Erkennung von Tarnzielen (COD), die die Cross-modal Chains of Thought Prompting (CCTP)-Technik nutzt, um visuelle Prompts zu verstehen, und universelle Textprompts verwendet, um zuverlässige visuelle Hinweise zu erhalten. Die Methode generiert und optimiert visuelle Prompts während des Tests automatisch durch progressive Maskengenerierung (PMG), ohne zusätzliches Training, und ermöglicht so eine effiziente und genaue Segmentierung von Tarnzielen.