ActAnywhere

ActAnywhere是一个主体感知视频背景生成模型。

普通产品视频视频处理视频生成

ActAnywhere是一个用于自动生成与前景主体运动和外观相符的视频背景的生成模型。该任务涉及合成与前景主体运动和外观相一致的背景,同时也符合艺术家的创作意图。ActAnywhere利用大规模视频扩散模型的力量,并专门定制用于此任务。ActAnywhere以一系列前景主体分割作为输入,以描述所需场景的图像作为条件,生成与条件帧相一致的连贯视频,同时实现现实的前景和背景交互。该模型在大规模人机交互视频数据集上进行训练。大量评估表明该模型的性能明显优于基准,可以泛化到各种分布样本,包括非人类主体。

Best AI Websites & Tools

ActAnywhere

ActAnywhere 替代品

VidPanos — 从手机拍摄的平移视频中生成全景视频

GameFactory — GameFactory 是一个基于预训练视频扩散模型的通用世界模型，可创建开放领域的游戏。

AI Kissing Video Generator Free — 利用先进人工智能技术，将静态照片转化为浪漫接吻动画。

Seaweed-APT — Seaweed-APT是一种支持实时单步生成1280x720 24fps视频的模型。

Luma Ray2 — 大规模视频生成模型，可创建逼真视觉效果与自然连贯动作。

MemenomeLM — 将PDF转化为引人入胜的视频，加速学习过程。

KLINGAI — 下一代AI创意工作室，支持视频和图像生成及编辑。

Hallo3 — 一种基于扩散变换器网络的高动态、逼真肖像图像动画技术。

Diffusion as Shader — 一种支持多种视频生成控制任务的统一架构模型。

StereoCrafter — 将单目视频转换为沉浸式立体3D视频的框架

VidTok — 微软开源的视频分词器家族

API.box — 轻松集成先进AI接口，赋能项目。

DiTCtrl — 探索多模态扩散变换器中的注意力控制，实现无需调优的多提示长视频生成

Image To Video — 使用AI技术将静态图片转换成动态视频。

Synthesys — AI内容生成平台，提供视频、语音和图像生成服务

DisPose — 一种用于控制人类图像动画的方法

Ruyi-Models — 一款能够生成电影级质量视频的图像到视频模型

Ruyi-Mini-7B — 开源图像到视频生成模型

INFP — 音频驱动的交互式头部生成框架，用于双人对话。

AI Kissing Video Generator — 使用AI技术将照片转化为逼真的亲吻视频。

Ruyi — 图生视频大模型，专为动漫和游戏场景设计

FastHunyuan — 快速生成高质量视频的模型

ComfyUI-HunyuanVideoWrapper-IP2V — 基于HunyuanVideo的视频生成工具，支持图像到视频的转换

Veo 2 — Google DeepMind的先进视频生成模型

WePOINTS — WePOINTS项目，提供多模态模型的统一框架

CausVid — 快速因果视频生成器，实现即时视频生成。

ComfyUI_HelloMeme — 基于扩散模型的图像和视频生成工具

SynCamMaster — 多视角视频生成同步技术

EndlessAI — AI视频能力展示平台