华为、复旦联手打造3D数字人新框架EmoTalk3D:喜怒哀乐表情逼真丰富

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Aug 7, 2024

379

在3d数字人领域，尽管已有显著进展，但此前的方法仍存在多视角一致性及情感表现力不足的问题。为解决这些难题，来自南京大学、复旦大学和华为诺亚方舟实验室的研究团队有了新突破。

产品入口：https://nju-3dv.github.io/projects/EmoTalk3D/

他们收集了带有校准多视角视频、情感标注和逐帧3D 几何的 EmoTalk3D 数据集。并提出了一种用于合成具有可控情感的3D 说话头像的新方法，在唇同步和渲染质量方面都有显著提升。

数据集：

通过在 EmoTalk3D 数据集上进行训练，研究团队构建了一个“从语音到几何再到外观”的映射框架。首先从音频特征预测出逼真的3D 几何序列，然后基于预测的几何合成由4D 高斯表示的3D 说话头像的外观。外观进一步分解为标准和动态高斯，从多视角视频中学习，并融合以呈现自由视角的说话头像动画。

该模型能够在生成的说话头像中实现可控情感，并可在大范围视角中进行渲染。在捕捉皱纹和细微表情等动态面部细节的同时，展现出了在唇动生成方面改进的渲染质量和稳定性。在生成结果的示例中，精准的展示了3D数字人的开心、生气、沮丧的表情。

其整体流程包含五个模块:

一是情感内容分解编码器，从输入语音中解析内容和情感特征;二是语音到几何网络，从特征预测动态3D 点云;三是高斯优化和完成模块，建立标准外观;四是几何到外观网络，基于动态3D 点云合成面部外观;五是渲染模块，将动态高斯渲染为自由视角动画。

此外，他们还建立了 EmoTalk3D 数据集，这是一个带有逐帧3D 面部形状的情感标注多视角说话头像数据集，并将为非商业研究目的向公众开放。

划重点:
💥 提出合成可控情感数字人的新方法。
🎯 构建“从语音到几何再到外观”的映射框架。
👀 建立 EmoTalk3D 数据集并准备开放。

Meshcapade推出SMPL建模技术：100个参数实现3D人体动作精准还原

近日，3D数字人类建模领域的创新企业Meshcapade凭借其突破性的人体动作生成技术引发业界关注。该公司通过将复杂的人类行为压缩为100个数字的参数化模型SMPL，正在重新定义数字人类建模的未来。作为图宾根马克斯普朗克智能系统研究所的子公司，Meshcapade自2018年成立以来已迅速成长为3D人体技术领域的领军企业。目前，其客户群已覆盖服装、健身、AR/VR、远程呈现和娱乐等多个领域，其中包括纳斯达克前十大公司中的六家。该公司的核心技术SMPL（蒙皮多人线性模型）突破了传统动作捕捉

3D数字人秀翻天！Rendora AI让你秒变好莱坞大导演

Rendora AI 是一款革命性的视频制作工具，专为轻松生成高质量 3D 数字人视频而设计。只需输入文字，即可在几秒钟内创造出栩栩如生的 3D 数字人，支持定制样貌、服装、妆容等，甚至能从照片生成个性化分身。平台提供400多个专业级3D场景，包含灯光和镜头角度，适合制作营销视频、教育培训内容等。Rendora AI 兼具视频生成与后期制作功能，支持根据文字自动生成镜头角度，无需专业摄影知识。适合创意人士、营销人员和教育工作者使用，可访问官网了解更多：https://top.aibase.com/tool/rendora

AI日报：GPT-4o新版本上线；面壁智能开源手机版“GPT-4V”；华为推3D数字人新框架EmoTalk3D；阿里上线奥运时刻海报工作流

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、开发者狂喜！AI的能力存在问题但可解决，需要在整个开发栈中进行更多工作，同时应注意“锯齿状边缘”并保持人类参与度。

百度曦灵数字人平台升级支持文生 3D 数字人、音色克隆等功能

自6月20日起，百度智能云曦灵数字人平台将迎来一次重大的革新升级。这次升级不仅实现了精美2D/3D数字人的高效低成本生成，更在直播、短视频、对话等多个场景内实现了矩阵式打通，全面提升了用户体验。无论是企业IP打造、文旅IP设计，还是娱乐IP开发，曦灵平台都能提供一站式智能、便捷、好用的数字人服务。

阿里推出Make-A-Character项目，一句话生成超逼真3D数字人

["阿里推出Make-A-Character项目，一句话生成超逼真的3D数字人","该项目支持通过文字描述生成逼真的3D角色","用户可以自定义面部特征，如脸型、眼睛颜色、发型等","角色基于真实人类扫描数据集生成，实现高质量实时渲染效果","生成的3D角色可无缝集成到现有的计算机图形工作流程中"]

浙大研究团队推出新AI框架Human101：单视角视频构建高保真3D数字人

["Human101采用创新的3D高斯散点技术，以仅100秒训练时间生成高保真的动态3D数字人体模型。","实现了100+ FPS的实时渲染速度，相比以往方法提供更快速的渲染并保持高质量。","Human101开源项目发布于GitHub，为实时交互应用和虚拟现实体验提供可行性。","引入了规范人体初始化和前向高斯动画方法，显著提高了模型的收敛速度和视觉细节表达。"]

AI资讯

AI日报

AI时间线

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图

华为、复旦联手打造3D数字人新框架​EmoTalk3D:喜怒哀乐表情逼真丰富

AIbase基地

本文来自AIbase日报

相关AI新闻推荐