Sana é um framework de geração de imagem a partir de texto desenvolvido pela NVIDIA, capaz de gerar imagens de alta definição com resolução de até 4096×4096, com alta consistência texto-imagem e velocidade excepcional, podendo ser implantado em GPUs de laptops. O modelo Sana é baseado em transformadores de difusão linear, usando um codificador de texto pré-treinado e um codificador de recursos latentes espacialmente comprimidos. A importância dessa tecnologia reside na sua capacidade de gerar imagens de alta qualidade rapidamente, tendo um impacto revolucionário na criação artística, design e outras áreas criativas. O modelo Sana segue a licença CC BY-NC-SA 4.0, e o código-fonte pode ser encontrado no GitHub.