AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

CAP4D：上传参考图即可生成高质量4D角色头像

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Dec 23, 2024

519

近日，来自多伦多大学及向量研究所的研究团队发布了 CAP4D 模型，这是一种基于形变多视角扩散模型（MMDM）的新技术，能够通过任意数量的参考图像生成逼真的4D 头像。

该模型采用双阶段方法，首先利用 MMDM 生成不同视角和表情的图像，然后将这些生成的图像与参考图像结合，重建出一个可实时控制的4D 头像。

在 CAP4D 的工作流程中，用户可以输入任意数量的参考图像，这些图像将被编码到变分自编码器的潜在空间中。接着，使用现成的面部追踪技术 FlowFace 估计每张参考图像的3D 形变模型（FLAME），从中提取出头部姿态、表情及摄像机视角等信息。MMDM 则通过随机采样的方式，在每一步迭代生成过程中，结合输入的参考图像生成多个不同的图像。

该研究团队展示了 CAP4D 生成的各种头像，涵盖了单张参考图像、少量参考图像和挑战性更大的从文本提示或艺术作品生成头像的场景。通过使用多张参考图像，模型能够恢复出单张图像中无法看到的细节与几何形状，从而提升了重建效果。此外，CAP4D 还具备与现有图像编辑模型相结合的能力，使得用户可以对生成的头像进行外观和光照的编辑。

为了进一步提升头像的表现力，CAP4D 能够将生成的4D 头像与语音驱动动画模型结合，实现音频驱动的动画效果。这使得头像不仅能够展现静态的视觉效果，还能通过声音与用户进行动态互动，开创了虚拟头像应用的新领域。

划重点:
🌟 CAP4D 模型能够通过任意数量的参考图像生成高质量的4D 头像，采用双阶段工作流程。
🖼️ 该技术可以生成多种不同视角的头像，显著提高了图像重建效果和细节呈现。
🎤 CAP4D 与语音驱动动画模型相结合，实现音频驱动的动态头像，拓展了虚拟头像的应用场景。

CAP4D 形变多视角扩散模型 4D头像

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

AI资讯

AI日报

AI时间线

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图

CAP4D：上传参考图即可生成高质量4D角色头像

AIbase基地

本文来自AIbase日报