Mit der Entwicklung digitaler Kunst gewinnt die automatisierte Bildverarbeitung zunehmend an Bedeutung. Kürzlich hat ein Forschungsteam der Tsinghua Universität und des Tencent ARC Lab ein neues Modell zur Farbgebung von Bildsequenzen namens ColorFlow vorgestellt. Dieses Modell zielt darauf ab, bei der Kolorierung von Schwarz-Weiß-Bildsequenzen die Konsistenz der Identität von Figuren und Objekten zu gewährleisten und die praktischen Anforderungen von Branchen wie Comics und Animationen zu erfüllen.

ColorFlow ist ein dreistufiges Framework auf Diffusionsbasis, das Kontextinformationen optimal nutzt und durch einen Referenzbildpool genaue Farben für Schwarz-Weiß-Bildsequenzen generiert. Das Modell kann beispielsweise effektiv die Haarfarbe und Kleidung von Figuren einfärben und dabei die Farbkohärenz mit dem Referenzbild sicherstellen. Im Gegensatz zu bisherigen Techniken, die für jede Figur ein Feintuning erfordern, vereinfacht ColorFlow den Farbgebungsprozess durch eine innovative, hochgradig generalisierbare Pipeline zur retrieval-gestützten Farbgebung.

image.png

Das Modell besteht aus zwei Hauptzweigen: Ein Zweig extrahiert die Farbidentität, der andere Zweig übernimmt den eigentlichen Kolorierungsprozess. Dieses Zwei-Zweig-Design nutzt die Vorteile von Diffusionsmodellen optimal und ermöglicht durch einen Selbstaufmerksamkeitsmechanismus starkes kontextuelles Lernen und Farbidentitätsabgleich. Um die Effektivität von ColorFlow zu validieren, hat das Forschungsteam ColorFlow-Bench entwickelt, einen umfassenden Benchmark speziell für referenzbildbasierte Kolorierungsaufgaben.

image.png

In Vergleichsexperimenten übertraf ColorFlow bestehende hochmoderne Modelle in mehreren Metriken und zeigte eine höhere ästhetische Qualität mit Farben, die den Originalbildern näher kommen. Das Forschungsteam demonstrierte die Anwendung von ColorFlow in verschiedenen künstlerischen Szenarien, darunter Schwarz-Weiß-Comics, Line Art, Fotos aus der realen Welt und animierte Storyboards, und erzielte in allen Fällen zufriedenstellende Ergebnisse.

ColorFlow setzt nicht nur einen neuen Standard für die automatisierte Farbgebung von Bildsequenzen, sondern unterstützt auch die Weiterentwicklung der Kunstindustrie. Das Forschungsteam hofft, dass diese Technologie in der Praxis breitere Anwendung findet und Innovation und Fortschritt in der digitalen Kunstproduktion vorantreibt.

Projektseite:https://zhuang2002.github.io/ColorFlow/

Wichtigste Punkte:

🌟 ColorFlow ist ein innovatives Modell zur Farbgebung von Schwarz-Weiß-Bildsequenzen, das die Konsistenz der Figurenidentität bewahrt.

🎨 Das Modell verwendet ein Zwei-Zweig-Design, wobei ein Zweig die Farbidentität extrahiert und der andere die eigentliche Farbgebung übernimmt, wodurch die Effektivität und Effizienz der Farbgebung verbessert werden.

🏆 ColorFlow übertrifft bestehende hochmoderne Modelle in mehreren Metriken und zeigt eine höhere ästhetische Qualität und Praktikabilität.