谷歌最新黑科技：AI 帮你"重拍"已录制视频，专业级后期效果触手可及

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年11月12号 10:20

167

谷歌研究团队最新推出的 ReCapture 技术，正在颠覆传统视频编辑的玩法。这项创新让普通用户也能轻松实现专业级的摄像机运动调整，为已拍摄的视频重新设计镜头语言。

传统视频后期制作中，改变已拍摄视频的镜头角度一直是个技术难题。现有方案在处理不同类型的视频内容时，往往难以同时保持复杂的运镜效果和画面细节。ReCapture 另辟蹊径，没有采用传统的4D 中间表示方法，而是巧妙利用生成式视频模型中储存的运动知识，通过 Stable Video Diffusion 将任务重新定义为视频到视频的转换过程。

这套系统采用两阶段工作流程。第一阶段生成"锚定视频"，也就是具有新机位的初始输出版本。这一阶段可以通过 CAT3D 等扩散模型创建多角度视频，或者通过逐帧深度估计和点云渲染来实现。虽然这个版本可能存在一些时序不连贯和视觉瑕疵，但为第二阶段奠定了基础。

第二阶段应用带遮罩的视频微调，利用在现有素材上训练的生成式视频模型来创建真实的运动效果和时序变化。系统引入了时序 LoRA（低秩适应）层来优化模型，使其能够理解和复制锚定视频的具体动态特征，无需重新训练整个模型。同时，空间 LoRA 层确保了画面细节和内容与新的摄像机运动保持一致。这使得生成式视频模型能够在保持原始视频特征运动的同时，完成变焦、平移和倾斜等操作。

尽管 ReCapture 在用户友好的视频处理方面取得了重要进展，但目前仍处于研究阶段，距离商业化应用还有一段距离。值得注意的是，虽然谷歌拥有众多视频 AI 项目，但尚未将其推向市场，其中 Veo 项目可能最接近商用。同样，Meta 最近推出的 Movie-Gen 模型以及 OpenAI 年初发布的 Sora 也都未实现商业化。目前，视频 AI 市场主要由 Runway 等创业公司引领，该公司已于去年夏天推出了最新的 Gen-3Alpha 模型。

Instagram AI视频功能即将上线，轻松修改视频外观和背景

Instagram 的负责人亚当・莫塞里（Adam Mosseri）在最近发布的一段视频中，透露了即将推出的生成式 AI 功能。这些新工具将允许用户通过文本提示，几乎 “改变他们视频的任何方面”。这些视频编辑工具将基于 Meta 公司的 Movie Gen AI 模型，预计将在明年正式上线。莫塞里在视频中表示:“我们正在为视频创作者们开发一些非常激动人心的 AI 工具。很多用户创作的精彩内容让 Instagram 焕发活力，我们希望为你们提供更多的工具，以实现你们的创意。” 他补充道，用户将能够随心所欲地修改视频内

印度视频编辑平台 InVideo 推出"文本生成视频"新功能，月收费近千元

视频编辑平台 InVideo 近日推出重磅升级版本 v3.0，引入了基于人工智能的文本生成视频功能。用户只需输入文字提示，即可创建真人实拍、动画或二次元风格的视频内容，并可针对 YouTube、Instagram Reels 和 LinkedIn 等不同平台进行定制化调整。这项新功能虽然依赖第三方 AI 模型构建，但用户可以通过追加文字提示对视频进行实时动态编辑。InVideo 为此专门推出了名为"Generative Plan"的订阅计划，起步价为每月120美元，可生成15分钟的视频内容，用户可根据需求购买更多时长。尽管这次升级显著提升

苹果发布Final Cut Pro 11，支持AI驱动的视频编辑

苹果发布了Final Cut Pro11，带来了一系列新功能，包括AI驱动的磁性遮罩和Transcribe to Captions等。该软件将于周三开放下载，现有用户将免费获得更新，而新用户则需要支付300美元才能下载。Final Cut Pro11带来的新功能包括:磁性遮罩:可以轻松地从视频中裁剪人物和物体，而无需依赖绿屏。 Transcribe to Captions:可以自动将视频中的对话转换为字幕。混合现实编辑:可以编辑iPhone捕捉的空间视频，并添加颜色校正、效果和标题。Magnetic Timeline:可以快速重新排列剪辑，同时保持音频与视频同步。苹果表示

Meta 推出新一代视频生成模型 MarDini，搞定填补视频缺失帧任务

最近，Meta 与沙特阿拉伯的阿卜杜拉国王科技大学（KAUST）合作，推出了一款全新的视频扩散模型系列 ——MarDini。这个模型让高质量视频的创作变得更加简单和灵活，能够完成多种任务，比如填补视频中缺失的帧，将单张图片转换为动态场景，甚至还可以通过添加自然的连续帧来扩展短片段。在去年的基础上，Meta 在生成 AI 视频领域进一步发力。此前，它推出了 Emu Video 和 Emu Edit 等文本转视频和编辑模型。今年在发布 MarDini 之前，还推出了先进的视频编辑器 Movie Gen。由此可见，Meta 正在致