Best AI Websites & Tools

AI产品榜

AI产品榜

TCAN

使用扩散模型实现时间一致性的人像动画

普通产品视频人像动画扩散模型

TCAN是一种基于扩散模型的新型人像动画框架，它能够保持时间一致性并很好地泛化到未见过的领域。该框架通过特有的模块，如外观-姿态自适应层(APPA层)、时间控制网络和姿态驱动的温度图，来确保生成的视频既保持源图像的外观，又遵循驱动视频的姿态，同时保持背景的一致性。

TCAN

外观-姿态自适应(APPA层)：在保持源图像外观的同时，维持来自冻结控制网的姿态信息。
时间控制网络：防止生成视频因突然和错误的姿态变化而崩溃。
姿态驱动的温度图：在推理阶段通过平滑时间层的注意力分数来减少静态区域的闪烁。
时间一致性：确保动画过程中人物姿态的连贯性。
泛化能力：能够适应不同领域和身份的动画生成。
背景保持：在动画过程中保持源图像背景的一致性。
多身份动画：能够将动作转移到不同身份的人物或动画角色上。

TCAN适用于需要进行高质量人像动画生成的领域，如电影制作、游戏开发、虚拟现实等。它特别适合那些需要在保持人物外观和背景一致性的同时，实现复杂动作和姿态变化的动画制作者。

电影制作中，用于生成角色的动作场景。
游戏开发中，用于创建角色的动态表现。
虚拟现实中，用于生成与用户互动的虚拟角色动画。

1. 准备源图像和驱动视频，确保它们包含所需的人物外观和动作。
2. 使用TCAN模型进行人像动画生成，输入源图像和驱动视频。
3. 调整TCAN模型中的参数，如APPA层的权重和时间控制网络的强度，以获得最佳动画效果。
4. 利用姿态驱动的温度图减少动画中的闪烁和不连贯现象。
5. 观察生成的动画，确保时间一致性和背景保持符合预期。

TCAN 最新流量情况

月总访问量

274

跳出率

39.60%

平均页面访问数

1.0

平均访问时长

00:00:00

TCAN 访问量趋势

TCAN 访问地理位置分布

TCAN 流量来源

TCAN 替代品

TCAN — 使用扩散模型实现时间一致性的人像动画

•人像动画•扩散模型

Project Starlight — Project Starlight 是一款基于 AI 的视频增强工具，可将低分辨率和损坏的视频提升为高清质量。

•AI 视频增强•高清修复

JoyVASA — 基于扩散模型的音频驱动人像和动物图像动画技术

•人像动画•音频驱动

AccVideo

AccVideo — 加速视频扩散模型，生成速度提升 8.5 倍。

•视频生成•扩散模型

InfiniteYou — 实现灵活且高保真度的图像生成，同时保持身份特征。

•图像生成•身份保护

TrajectoryCrafter

TrajectoryCrafter — 通过扩散模型实现单目视频的相机轨迹重定向。

•视频编辑•相机轨迹

Inception Labs — Inception Labs 推出新一代扩散式大语言模型，提供极速、高效和高质量的语言生成能力。

•语言模型•扩散模型

Mercury Coder — Mercury Coder 是一款基于扩散模型的高性能代码生成语言模型。

•代码生成•扩散模型

VideoGrain — VideoGrain 是一种零样本方法，用于实现类别级、实例级和部件级的视频编辑。

•视频编辑•扩散模型

MakeAnything — MakeAnything 是一个用于多领域程序化序列生成的扩散变换器模型。

•生成式 AI•多领域生成

Pippo — Pippo 是一个从单张照片生成高分辨率多人视角视频的生成模型。

•图像生成•多视角视频

On-device Sora — On-device Sora 是一个基于扩散模型的移动设备端文本到视频生成项目。

•视频生成•移动设备

DiffSplat — DiffSplat 是一个从文本提示和单视图图像生成 3D 高斯点云的生成框架。

•3D 生成•高斯点云

Go with the Flow — 一种用于控制视频扩散模型运动模式的高效方法，支持运动模式的自定义和迁移。

•视频生成•运动控制

TokenVerse — TokenVerse 是一种基于预训练文本到图像扩散模型的多概念个性化方法。

•图像生成•个性化

X-Dyna — X-Dyna是一种基于扩散模型的零样本人类图像动画生成技术。

•图像动画•零样本学习

Hunyuan3D 2.0 — Hunyuan3D 2.0 是腾讯推出的高分辨率 3D 资产生成系统，基于大规模扩散模型。

•3D•纹理生成

Diffusion as Shader

Diffusion as Shader — 一种支持多种视频生成控制任务的统一架构模型。

•视频生成•3D感知

CreatiLayout — 基于孪生多模态扩散变换器的创意布局到图像生成技术

•图像生成•多模态

VMix

VMix — 文本到图像扩散模型的美学质量提升工具

•文本到图像•扩散模型

DiffSensei — 定制化漫画生成模型，连接多模态LLMs和扩散模型。

•漫画生成•多模态

DynamicControl

DynamicControl — 自适应条件选择，提升文本到图像生成控制力

•文本到图像•扩散模型

InvSR — 基于扩散反转的多步图像超分辨率模型

•图像超分辨率•扩散模型

ColorFlow

ColorFlow — 图像序列着色模型，保留细粒度身份信息

•图像着色•身份保留

Leffa — 可控人物图像生成模型

•图像生成•虚拟试穿

ComfyUI_HelloMeme — 基于扩散模型的图像和视频生成工具

•图像生成•视频生成

StableAnimator

StableAnimator — 高质量身份保留的人像动画合成工具。

•视频合成•人像动画

Color-diffusion

Color-diffusion — 利用扩散模型为黑白图片上色

•图像着色•扩散模型

FLOAT — 基于流匹配的音频驱动说话人像视频生成方法

•人像动画•音频驱动

AnchorCrafter — 基于扩散模型的2D视频生成系统，实现人-物交互动画。

•视频生成•人-物交互