Motion-I2V

一种可控的图像到视频生成框架

普通产品图像图像生成视频生成

Motion-I2V是一种全新的框架，用于实现一致且可控的图像到视频生成（I2V）。与以往直接学习复杂图像到视频映射的方法不同，Motion-I2V将I2V分解为两个阶段，并采用显式运动建模。在第一阶段，我们提出了基于扩散的运动场预测器，专注于推断参考图像像素的轨迹。在第二阶段，我们提出了增强的运动增强时间注意力，以增强视频潜在扩散模型中有限的一维时间注意力。该模块可以在第一阶段预测的轨迹的指导下，有效地将参考图像特征传播到合成帧。与现有方法相比，Motion-I2V即使在存在大运动和视角变化的情况下，也能生成更一致的视频。通过为第一阶段训练稀疏轨迹控制网络，Motion-I2V可以支持用户精确控制运动轨迹和运动区域，具有稀疏轨迹和区域注释的控制能力。这比仅依赖文本说明更可控。此外，Motion-I2V的第二阶段自然地支持零样本视频到视频转换。定性和定量比较表明，Motion-I2V在一致且可控的图像到视频生成方面优于先前的方法。

Best AI Websites & Tools

Motion-I2V

Motion-I2V 最新流量情况

Motion-I2V 访问量趋势

Motion-I2V 访问地理位置分布

Motion-I2V 流量来源

Motion-I2V 替代品

Krea Chat — Krea Chat 是一个由 DeepSeek 提供支持的 AI 聊天工具，将 Krea 的所有功能集成到聊天界面中。

API.box — 轻松集成先进AI接口，赋能项目。

ComfyUI_HelloMeme — 基于扩散模型的图像和视频生成工具

智趣AI甄选 — 探索AI前沿，精选国内外AI产品与应用。

Emu3 — 下一代多模态智能模型

HelloMeme — 集成空间编织注意力，提升扩散模型的高保真条件

DeepMind — 谷歌旗下领先的人工智能研究公司

Stability AI — 通过生成式AI激活人类潜能

ControlNeXt — 可控视频和图像生成技术

PCM — 一种新的文本条件高分辨率生成模型

Darwin Studio — AI图像、视频和广告生成器

StoryDiffusion — StoryDiffusion 能够通过生成一致的图像和视频来创造魔法故事。

DeepAI — 智能工具，激发创意无限

GenAI Courses — AI学习平台

Wookeys AI — 一站式AI助手，为您提供生成文本、图像、代码、视频、音频等的解决方案

ApolloAI — AI图像、视频、音乐生成工具

Drip Art AI — AI云平台，为Comfy UI提供强大支持

W.A.L.T — W.A.L.T是一个基于变分扩散模型的实景视频生成方法

Snowpixel — 用文字创建、定制、吸引，Snowpixel 让您轻松生成美丽的图片、视频、音乐等作品。

Promp — 发现、创新、变现AI创意

Astria — 智能AI图像生成

AI Kungfu Video Generator — 使用Hailuo AI技术在线生成专业功夫视频。

Phantom — Phantom 是一款基于跨模态对齐的主体一致性视频生成模型。

WHAM — WHAM 是微软开发的一种生成式游戏模型，用于生成游戏视觉和控制器动作。

爱涂鸭 — 爱涂鸭是一个提供创意绘画和创作分享的在线平台。

SkyReels-V1-Hunyuan-I2V — SkyReels V1 是一个开源的人类中心视频基础模型，专注于高质量影视级视频生成。

SkyReels-V1 — SkyReels-V1 是首个开源的人类中心视频基础模型，专注于高质量视频生成。

FlashVideo — FlashVideo 是一个高效的高分辨率视频生成模型，专注于细节和保真度的流动。

Pippo — Pippo 是一个从单张照片生成高分辨率多人视角视频的生成模型。