Des chercheurs de l'École polytechnique fédérale de Zurich (EPFZ) ont réalisé une innovation en matière d'estimation de profondeur monoculaire en modifiant le modèle open source Stable Diffusion Marigold. Sans avoir besoin de données d'entraînement d'images de profondeur réelles, le modèle a atteint des performances exceptionnelles grâce au réglage fin du module U-Net de débruitage.
Entraîné sur des données synthétiques, Marigold est capable d'apprendre une large gamme de scènes, améliorant ainsi sa capacité de généralisation sur des ensembles de données inconnues. L'approche technique principale repose sur l'exploitation des connaissances a priori de Stable Diffusion et l'utilisation d'une méthode d'estimation de profondeur affine-invariante, éliminant ainsi les erreurs d'estimation de profondeur causées par l'incertitude des paramètres intrinsèques de la caméra.