国庆节偷偷搞个大的！Meta视频生成Movie Gen登场 16秒高清视频一键生成还带配音

AIbase基地

发布于AI新闻资讯 · 2 分钟阅读 · 2024年10月8号 6:02

117

Meta 近日重磅发布 Movie Gen，这款堪称"元宇宙版 Sora"的 AI 视频生成模型，不仅能一键创作高质量视频，还能为视频配音、编辑剪辑，甚至将个人照片变成个性化视频。

随着92页技术报告的同步公开，Movie Gen 的强大功能和先进架构引发业界广泛关注。

Movie Gen Video:高清视频生成的革新

Movie Gen 由两大核心模型组成:Movie Gen Video 和 Movie Gen Audio。其中，Movie Gen Video 是一个拥有300亿参数的 Transformer 模型，可根据文本提示生成1080P 分辨率、16秒长、每秒16帧的高清视频。

主要功能:

文本生成视频:通过简单文本输入创作高质量定制视频

视频编辑:精确修改现有视频的风格和内容

个性化视频:将个人照片转化为动态视频

音频生成:为视频配音、添加音效和背景音乐

该模型借鉴了 Llama3的架构设计，并采用"流匹配"技术，在视频精度和细节表现上超越了传统的扩散模型。

从演示效果看，Movie Gen生成的视频在画面质量、光影效果和动作流畅度上都达到极高水准。人物面部稳定、动物毛发逼真、背景细节丰富，令人惊叹。音频生成同样出色，不仅能创作符合场景氛围的背景音乐，还能精准匹配视频动作节点。

Movie Gen Audio:同步音频生成的突破

Movie Gen Audio 则是一个130亿参数的模型，能为视频生成48kHz 的高质量配音和音乐。它不仅可以生成与视频同步的音效，还能创作符合场景氛围的背景音乐，甚至实现长达数分钟的连贯音频制作。

个性化视频:创造独一无二的内容

在功能方面，Movie Gen 展现了惊人的多样性和灵活性。用户可以通过简单的文本输入生成定制视频，编辑现有视频的风格和内容，甚至上传个人照片生成独特的个性化视频。这些功能使 Movie Gen 成为目前最先进的媒体基础模型之一。

Meta 公布的演示视频令人印象深刻。从雷雨交加的山景到海滩上放风筝的小女孩，再到戴着粉色太阳镜的树懒，Movie Gen 生成的视频在画面质量、光影效果和动作流畅度上都达到了极高水准。

更令人惊叹的是，它还能将普通照片转化为动态视频，如将小扎的照片变成健身视频。

技术上，Movie Gen采用多项创新:

基于Llama3的Transformer架构

流匹配训练方法提升视频质量

多阶段训练流程优化性能

Llama3辅助提示词重写提升生成质量

创新的视频编辑和音频扩展技术

尽管 Movie Gen 目前仍处于"期货"状态，预计要到明年才会向公众开放，但它的发布已经在业界引发巨大反响。有评论认为，Meta 此举不仅抢在了 OpenAI 之前发布类似 Sora 的产品，还可能激发其他公司加速推出下一代 AI 视频技术。

参考资料：https://x.com/AIatMeta/status/1842188252541043075

官网地址：https://ai.meta.com/research/movie-gen/

Instagram AI视频功能即将上线，轻松修改视频外观和背景

Instagram 的负责人亚当・莫塞里（Adam Mosseri）在最近发布的一段视频中，透露了即将推出的生成式 AI 功能。这些新工具将允许用户通过文本提示，几乎 “改变他们视频的任何方面”。这些视频编辑工具将基于 Meta 公司的 Movie Gen AI 模型，预计将在明年正式上线。莫塞里在视频中表示:“我们正在为视频创作者们开发一些非常激动人心的 AI 工具。很多用户创作的精彩内容让 Instagram 焕发活力，我们希望为你们提供更多的工具，以实现你们的创意。” 他补充道，用户将能够随心所欲地修改视频内

可灵1.6版本上线物理规律真实感大幅提升

在人工智能领域，技术迭代的速度总是令人惊叹。快手旗下AI视频生成工具可灵（Kling）在短短半年内，从追赶者一跃成为全球AI视频生成领域的领跑者。最新发布的1.6版本，展现了令人瞩目的技术进步。尽管版本号仅提升了0.1，但可灵1.6版带来的技术突破却远超预期。新版本在保持35灵感/5秒视频的亲民价格基础上，在三个核心维度实现了质的飞跃:物理规律真实感、人物表演能力和语义理解水平。物理规律真实感大幅提升对物理世界的精准演绎是这次更新的最大亮点。在切西红柿的测试中

谷歌和Meta的两倍！微软今年购买了近50万颗Nvidia Hopper芯片

2024年，微软在人工智能芯片市场的布局取得了显著进展。根据《金融时报》的报道，微软今年购买了多达485，000颗 Nvidia Hopper 芯片，这一数字是其主要竞争对手 Meta 和 Google 的两倍以上。作为 Nvidia 的旗舰产品，Hopper 芯片在市场上备受青睐，而微软的采购数量更是比2023年大幅增加了三倍。微软的这一举措显示出其在人工智能领域的野心。除了大量采购 Hopper 芯片外，微软还计划推出自家的定制 AI 芯片，名为 Maia。这一消息是在2023年晚些时候的 Ignite 大会上宣布的，表明微软在芯片开发方面

爱诗科技完成近3亿人民币融资，AI视频生成平台PixVerse用户破千万

中国AI视频生成初创公司爱诗科技近日宣布完成A2至A4轮融资，总金额近3亿元人民币。此前，A2轮融资由蚂蚁集团投资，而近期的A3和A4轮融资则由北京市人工智能产业投资基金、国科投资以及光源资本共同注资。本轮融资将主要用于提升技术研发能力、扩展算力资源、建设人才团队，并加速产品功能迭代与市场覆盖，从而持续推动AI视频生成技术的普及应用。爱诗科技的核心AI视频生成产品PixVerse表现亮眼，全球用户已突破1200万，月活跃用户接近600万。自2024年10月V3版本发布以来，"毒液变身

AI新闻资讯

国庆节偷偷搞个大的！Meta视频生成Movie Gen登场 16秒高清视频一键生成 还带配音