AnimateAnythingは、カメラ軌道、テキストプロンプト、ユーザーのアクション注釈など、様々な条件下で正確かつ一貫性のあるビデオ操作を可能にする、統一制御可能なビデオ生成手法です。本技術は、多尺度制御特徴融合ネットワークを設計することで、様々な条件下における共通のモーション表現を構築し、全ての制御情報をフレームごとのオプティカルフローに変換することで、モーションガイドとしてビデオ生成を導きます。さらに、大規模なモーションによるちらつき問題を軽減するため、周波数ベースの安定化モジュールを提案し、周波数領域における一貫性を確保することで、時間的な連続性を向上させています。実験により、AnimateAnythingの手法は既存の最先端手法を上回る性能を示しています。