TCAN é uma nova estrutura de animação de retratos baseada em modelos de difusão, capaz de manter a consistência temporal e generalizar bem para domínios não vistos. A estrutura utiliza módulos exclusivos, como a camada de adaptação aparência-postura (camada APPA), a rede de controle temporal e o mapa de temperatura orientado por postura, para garantir que o vídeo gerado mantenha a aparência da imagem de origem, siga a postura do vídeo de direção e, ao mesmo tempo, mantenha a consistência do fundo.