Generative Powers of Tenは、テキストから画像へのモデルを用いてマルチスケールで一貫性のあるコンテンツを生成する方法です。森の広角風景から木の枝の昆虫のクローズアップまで、シーンの極端な意味的なズームを実現できます。この表現方法により、連続的にズームする動画のレンダリングや、シーンの様々なスケールをインタラクティブに探索することが可能になります。これは、異なるスケール間の一貫性を維持しつつ、個々のサンプリングプロセスの完全性を維持する、統合されたマルチスケール拡散サンプリング手法によって実現しています。生成される各スケールは異なるテキストプロンプトによって制御されるため、従来の超解像度手法(全く異なるスケールで新しいコンテキスト構造を作成することが難しい場合があります)よりも、より深いレベルのズームを実現できます。我々は、画像の超解像度と外部描画による代替技術と比較して、この手法が、一貫性のあるマルチスケールコンテンツの生成において最も効果的であることを示しました。