ObjectDrop ist eine überwachte Methode, die fotorealistische Objektentfernungen und -einfügungen ermöglicht. Sie nutzt ein Zählfakten-Dataset und selbstüberwachte Techniken. Die Hauptfunktionen umfassen das Entfernen von Objekten aus Bildern, inklusive der Beseitigung von Auswirkungen auf die Szene (z. B. Schatten, Verdeckungen und Reflexionen), sowie das fotorealistische Einfügen von Objekten. Objektentfernungen werden durch Feintuning eines Diffusionsmodells auf einem kleinen, speziell erfassten Dataset erreicht. Für das Einfügen von Objekten wird hingegen ein selbstüberwachter Ansatz verwendet: Das Entfernungsmodell synthetisiert ein großskaliges Zählfakten-Dataset, auf dem ein Modell trainiert und anschließend auf reale Daten feinabgestimmt wird, um ein qualitativ hochwertiges Einfügemodell zu erhalten. Im Vergleich zu früheren Methoden erzielt ObjectDrop eine deutlich verbesserte Realitätsnähe bei der Objektentfernung und -einfügung.