复旦、百度联手打造全新AI模型Hallo2 可生成4K超高清+1小时超长视频！

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Oct 18, 2024

768

复旦大学和百度公司的研究人员联合开发了一种名为 Hallo2的全新 AI 模型，该模型可以生成长达数小时的4K 分辨率人物动画，并且可以通过语音和文字提示进行精准控制。

一直以来，生成高质量的人物动画需要耗费大量的时间和人力成本。而 Hallo2的出现，有望彻底改变这一现状，为电影制作、虚拟助手、游戏开发等领域带来革命性的变化。

Hallo2模型建立在 latent diffusion models 的基础上，并引入了一系列创新性的技术，包括:

Patch-drop 数据增强技术:通过对运动帧进行随机遮挡，防止模型过度依赖前序帧的画面信息，从而保证生成的人物动画在长时间序列中保持稳定的外观。

高斯噪声增强技术:通过向运动帧中添加高斯噪声，增强模型对画面噪声和运动失真的鲁棒性，进一步提升动画的质量和连贯性。

VQGAN 离散码本预测技术:将 VQGAN 模型扩展到时间维度，并结合时间对齐技术，实现高分辨率视频的生成，并确保画面细节在时间上的连贯性。

文本提示控制机制:通过引入自适应层归一化机制，使模型能够根据文本提示精准地控制人物的表情和动作，使动画更具表现力和可控性。

Hallo2模型的强大性能已经在多个公开数据集上得到了验证，包括 HDTF、CelebV 以及研究人员自己创建的“Wild”数据集。实验结果表明，Hallo2在生成高质量、长序列人物动画方面超越了现有的所有方法。

Hallo2模型的发布标志着 AI 人物动画生成技术迈上了一个新的台阶。未来，研究人员计划进一步优化模型的效率和可控性，并探索其在更多领域的应用。

项目地址：https://fudan-generative-vision.github.io/hallo2/#/

论文地址：https://arxiv.org/pdf/2410.07718

从红包大战到 AI 对决：火山引擎或成为2026春晚独家合作伙伴

字节跳动旗下火山引擎成为2026年央视春晚独家AI云合作伙伴，其智能助手“豆包”将深度参与互动。春晚作为国民级IP，是互联网产品实现爆发式增长的关键战场，字节跳动此举意在复制微信支付等通过春晚实现突破的成功模式。

AI新闻资讯

最新AI日报

AI 商用·开源产品库

AI 产品排行榜

AI产品提交

AI工具导航

模型库

大模型排行榜

模型供应商

大模型选型对比

大模型费用计算器

大模型竞技场

MCP服务端

MCP客户端

MCP教程与实践

MCP排行榜

MCP服务提交

MCP实验场

MCP服务调试器

GEO品牌监控分析

GEO排名查询工具

GEO 大模型推荐优化

模型个人电脑配置检测器

模型部署服务器配置计算器

复旦、百度联手打造全新AI模型Hallo2 可生成4K超高清+1小时超长视频！

AIbase基地

本文来自AIbase日报

相关AI新闻推荐

英伟达云业务战略调整:重心转向内部 AI 开发

​微软纳德拉重返一线督战，Copilot付费增长为何陷入瓶颈?

​生数科技与清华大学联合推出 TurboDiffusion 视频生成加速框架

钉钉推出专为企业打造的 AI 硬件 DingTalk Real

AI日报：智谱发布开源编程大模型GLM-4.7;豆包或成为2026春晚AI合作伙伴;ChatGPT 推出年终回顾功能

​谷歌 DeepMind 发布 Gemma Scope 2：为 Gemma 3 模型提供全栈可解释性工具

从红包大战到 AI 对决：火山引擎或成为2026春晚独家合作伙伴

​加速端侧大模型进化：面壁智能获数亿元新融资，深度布局智能座舱与终端生态

吸金6.6亿美元!Steam 近八成游戏染指 AI，争议声中大作纷纷“沦陷”

苹果初代智能眼镜细节曝光，将成 iPhone 最强 AI 配件

相关AI新闻推荐

英伟达云业务战略调整:重心转向内部 AI 开发

​微软纳德拉重返一线督战，Copilot付费增长为何陷入瓶颈?

​生数科技与清华大学联合推出 TurboDiffusion 视频生成加速框架

钉钉推出专为企业打造的 AI 硬件 DingTalk Real

AI日报：智谱发布开源编程大模型GLM-4.7;豆包或成为2026春晚AI合作伙伴;ChatGPT 推出年终回顾功能

​谷歌 DeepMind 发布 Gemma Scope 2：为 Gemma 3 模型提供全栈可解释性工具

从红包大战到 AI 对决：火山引擎或成为2026春晚独家合作伙伴

​加速端侧大模型进化：面壁智能获数亿元新融资，深度布局智能座舱与终端生态

吸金6.6亿美元!Steam 近八成游戏染指 AI，争议声中大作纷纷“沦陷”

苹果初代智能眼镜细节曝光，将成 iPhone 最强 AI 配件

微软纳德拉重返一线督战，Copilot付费增长为何陷入瓶颈?

生数科技与清华大学联合推出 TurboDiffusion 视频生成加速框架

谷歌 DeepMind 发布 Gemma Scope 2：为 Gemma 3 模型提供全栈可解释性工具

加速端侧大模型进化：面壁智能获数亿元新融资，深度布局智能座舱与终端生态

微软纳德拉重返一线督战，Copilot付费增长为何陷入瓶颈?

生数科技与清华大学联合推出 TurboDiffusion 视频生成加速框架

谷歌 DeepMind 发布 Gemma Scope 2：为 Gemma 3 模型提供全栈可解释性工具

加速端侧大模型进化：面壁智能获数亿元新融资，深度布局智能座舱与终端生态