ID-Aligner
Ein Feedback-Lern-Framework zur Verbesserung der Identitätserhaltung bei der Text-zu-Bild-Generierung.
Normales ProduktBildText-zu-BildIdentitätserhaltung
ID-Aligner ist ein Feedback-Lern-Framework zur Verbesserung der Identitätserhaltung bei der Text-zu-Bild-Generierung. Es adressiert Herausforderungen hinsichtlich der Erhaltung von Identitätsmerkmalen, der ästhetischen Attraktivität der generierten Bilder und der Kompatibilität mit LoRA- und Adapter-Methoden durch belohnungsbasiertes Feedbacklernen. Die Methode nutzt das Feedback von Gesichtserkennungs- und Identifikationsmodellen zur Verbesserung der Identitätserhaltung und liefert ästhetische Anpassungssignale durch menschlich annotierte Präferenzdaten und automatisch generiertes Feedback. ID-Aligner ist mit LoRA- und Adapter-Modellen kompatibel und seine Effektivität wurde durch umfangreiche Experimente bestätigt.