Ouroboros3D
Uma estrutura para geração de modelos 3D por meio de difusão recursiva com percepção 3D.
Produto ComumImagemGeração 3DDifusão Recursiva
O Ouroboros3D é uma estrutura unificada de geração 3D que integra a geração de imagens multivisuais baseada em difusão e a reconstrução 3D em um processo de difusão recursivo. A estrutura treina conjuntamente esses dois módulos por meio de um mecanismo autocondicionado, permitindo que eles se adaptem mutuamente para alcançar inferência robusta. No processo de desruído multivisual, o modelo de difusão multivisual usa o mapa de percepção 3D renderizado pelo módulo de reconstrução no passo de tempo anterior como uma condição adicional. A estrutura de difusão recursiva combinada com o feedback de percepção 3D melhora a consistência geométrica do processo geral. Experimentos demonstram que a estrutura Ouroboros3D supera os métodos que treinam essas duas etapas separadamente, bem como os métodos existentes que os combinam na etapa de inferência.