DynamicControl

Seleção adaptativa de condições, aprimorando o controle da geração de imagem a partir de texto.

Produto ComumImagemTexto para imagemModelo de difusão
DynamicControl é uma estrutura para aprimorar o controle de modelos de difusão de texto para imagem. Ele combina dinamicamente diversos sinais de controle, suportando a seleção adaptativa de diferentes quantidades e tipos de condições para sintetizar imagens de forma mais confiável e detalhada. A estrutura utiliza inicialmente um controlador de duplo ciclo, empregando modelos de geração e discriminação pré-treinados para gerar uma classificação inicial de pontuação de verdade para todas as condições de entrada. Em seguida, um avaliador de condições eficiente é construído com um Modelo de Linguagem Grande Multimodal (MLLM) para otimizar a classificação das condições. O DynamicControl otimiza conjuntamente o MLLM e o modelo de difusão, utilizando a capacidade de raciocínio do MLLM para facilitar tarefas de texto para imagem com múltiplas condições. As condições classificadas são então inseridas em um adaptador de múltiplos controles paralelos, que aprende os mapas de características das condições visuais dinâmicas e as integra para ajustar o ControlNet, aumentando o controle sobre as imagens geradas.
Abrir Site

DynamicControl Alternativas