AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

AI变现指南

最新案例

AI变现案例分享

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

最新教程

免费分享最新AI教程内容

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

热门国家排行榜

美国

美国用户最喜欢的AI网站

中国

中国用户最喜欢的AI网站

印度

印度用户最喜欢的AI网站

巴西

巴西用户最喜欢的AI网站

热门分类榜

图片生成

AI图片生成网站总访问量榜单

个人助理

AI个人助理网站总访问量榜单

角色生成网站

AI角色生成网站总访问量榜单

视频生成

AI视频生成网站总访问量榜单

热门开源数据榜单

AI项目榜单

热门AI项目总Start榜单

AI项目增速榜

热门AI项目增速榜

AI开发者排名

热门AI开发者排名

AI组织排名

热门AI组织排名榜单

热门开源分类

deepseek

热门deepseek开源项目

TTS

热门TTS开源项目

LLM

热门LLM开源项目

ChatGPT

热门ChatGPT开源项目

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

JoyVASA

基于扩散模型的音频驱动人像和动物图像动画技术

普通产品图像人像动画音频驱动

JoyVASA是一种基于扩散模型的音频驱动人像动画技术，它通过分离动态面部表情和静态3D面部表示来生成面部动态和头部运动。这项技术不仅能够提高视频质量和唇形同步的准确性，还能扩展到动物面部动画，支持多语言，并在训练和推理效率上有所提升。JoyVASA的主要优点包括更长视频生成能力、独立于角色身份的运动序列生成以及高质量的动画渲染。

JoyVASA

JoyVASA 最新流量情况

月总访问量

984

跳出率

30.54%

平均页面访问数

3.3

平均访问时长

00:12:47

JoyVASA 访问量趋势

JoyVASA 访问地理位置分布

JoyVASA 流量来源

JoyVASA 替代品

JoyVASA — 基于扩散模型的音频驱动人像和动物图像动画技术

•人像动画•音频驱动

FLOAT — 基于流匹配的音频驱动说话人像视频生成方法

•人像动画•音频驱动

Hallo2 — 高分辨率、长时音频驱动的人像图像动画技术

•人像动画•音频驱动

TCAN — 使用扩散模型实现时间一致性的人像动画

•人像动画•扩散模型

EchoMimic — 生成逼真动态人像视频的先进技术

•人像动画•音频驱动

AccVideo

AccVideo — 加速视频扩散模型，生成速度提升 8.5 倍。

•视频生成•扩散模型

InfiniteYou — 实现灵活且高保真度的图像生成，同时保持身份特征。

•图像生成•身份保护

TrajectoryCrafter

TrajectoryCrafter — 通过扩散模型实现单目视频的相机轨迹重定向。

•视频编辑•相机轨迹

Inception Labs — Inception Labs 推出新一代扩散式大语言模型，提供极速、高效和高质量的语言生成能力。

•语言模型•扩散模型

Project Starlight — Project Starlight 是一款基于 AI 的视频增强工具，可将低分辨率和损坏的视频提升为高清质量。

•AI 视频增强•高清修复

Mercury Coder — Mercury Coder 是一款基于扩散模型的高性能代码生成语言模型。

•代码生成•扩散模型

VideoGrain — VideoGrain 是一种零样本方法，用于实现类别级、实例级和部件级的视频编辑。

•视频编辑•扩散模型

JoyGen — JoyGen 是一种音频驱动的 3D 深度感知的说话人脸视频编辑技术。

•视频生成•音频驱动

LiteAvatar — 一个基于音频驱动的实时2D聊天头像生成模型，可在仅使用CPU的设备上实现30fps的实时推理。

•实时交互•虚拟头像

MakeAnything — MakeAnything 是一个用于多领域程序化序列生成的扩散变换器模型。

•生成式 AI•多领域生成

Pippo — Pippo 是一个从单张照片生成高分辨率多人视角视频的生成模型。

•图像生成•多视角视频

On-device Sora — On-device Sora 是一个基于扩散模型的移动设备端文本到视频生成项目。

•视频生成•移动设备

DiffSplat — DiffSplat 是一个从文本提示和单视图图像生成 3D 高斯点云的生成框架。

•3D 生成•高斯点云

Go with the Flow — 一种用于控制视频扩散模型运动模式的高效方法，支持运动模式的自定义和迁移。

•视频生成•运动控制

SyncAnimation

SyncAnimation — SyncAnimation 是一种基于 NeRF 的音频驱动实时生成说话头像和上半身动作的技术框架。

•NeRF•音频驱动

TokenVerse — TokenVerse 是一种基于预训练文本到图像扩散模型的多概念个性化方法。

•图像生成•个性化

X-Dyna — X-Dyna是一种基于扩散模型的零样本人类图像动画生成技术。

•图像动画•零样本学习

Hunyuan3D 2.0 — Hunyuan3D 2.0 是腾讯推出的高分辨率 3D 资产生成系统，基于大规模扩散模型。

•3D•纹理生成

Diffusion as Shader

Diffusion as Shader — 一种支持多种视频生成控制任务的统一架构模型。

•视频生成•3D感知

CreatiLayout — 基于孪生多模态扩散变换器的创意布局到图像生成技术

•图像生成•多模态

VMix

VMix — 文本到图像扩散模型的美学质量提升工具

•文本到图像•扩散模型

DiffSensei — 定制化漫画生成模型，连接多模态LLMs和扩散模型。

•漫画生成•多模态

DynamicControl

DynamicControl — 自适应条件选择，提升文本到图像生成控制力

•文本到图像•扩散模型

InvSR — 基于扩散反转的多步图像超分辨率模型

•图像超分辨率•扩散模型

INFP

INFP — 音频驱动的交互式头部生成框架，用于双人对话。

•音频驱动•交互式