Potencias Generativas de Diez es un método que utiliza modelos de texto a imagen para generar contenido multi-escala coherente. Permite el escalado semántico extremo de escenas, por ejemplo, desde una vista panorámica de un bosque hasta una toma macro de un insecto en una rama. Esta representación permite renderizar videos de escalado continuo o explorar interactivamente diferentes escalas de una escena. Lo logramos mediante un método de muestreo de difusión multi-escala conjunta que fomenta la coherencia entre las diferentes escalas, al tiempo que conserva la integridad de cada proceso de muestreo individual. Dado que cada escala generada está guiada por diferentes indicaciones de texto, nuestro método permite un escalado más profundo que los métodos tradicionales de súper resolución, que pueden tener dificultades para crear nuevas estructuras contextuales en escalas completamente diferentes. Hemos realizado una comparación cualitativa de nuestro método con técnicas alternativas de súper resolución de imágenes y pintura externa, demostrando que nuestro enfoque es el más eficaz para generar contenido multi-escala coherente.