爆火「视频版 ControlNet」开源了！靠提示词精准换画风，全华人团队出品

量子位

发布于AI新闻资讯 · 1 分钟阅读 · 2023年8月21号 10:42

全华人团队开发的视频处理算法 CoDeF 通过提示词精准控制视频的画风，同时保持口型一致。该算法利用内容形变场实现视频风格迁移任务，具有良好的跨帧一致性。CoDeF 的开源发布引起了网友们的热议，许多人认为这项技术在电影制作领域有巨大潜力。团队的研究成果已在 GitHub 上开源，供广大开发者使用。

中国科研团队重磅发布VideoChat-Flash 长视频处理速度提升100倍

传统的视频理解模型在处理长视频时面临着许多挑战，包括理解长视频所带来的复杂上下文。尽管已有不少研究致力于提升视频理解能力，依然难以有效克服训练和推理效率低下的问题。针对这些问题，研究团队通过 HiCo 技术，将视频信息中的冗余部分进行压缩，从而显著降低计算需求，同时保留关键信息。具体而言，HiCo 通过对视频进行层次化压缩，将长视频分割成短片段，进而减少处理的标记数量。这一方法不仅降低了模型对计算资源的要求，还提升了上下文窗口的宽度，增强了模型

以色列科技公司 Lightricks 发布 LTXV！4秒生成一个AI视频

以色列科技公司 Lightricks 近日推出了一款名为 LTX Video （LTXV）的闪电般快速的 AI 视频处理平台。该平台采用先进的人工智能模型，可以在常用的图形处理器 (GPU) 上运行。LTXV 于11月下旬发布，它可以在4秒内生成一个分辨率为768x512的5秒 AI 视频片段，这使其在其他 AI 视频平台中脱颖而出。其20亿个参数使其即使在英伟达 H100GPU 甚至 RTX4090上以每秒30.25帧的速度运行时，也能提供快速的处理时间，且不影响视频的质量和一致性。除了短片段外，LTXV 还支持长篇 AI 视频，为创作者提供了更大的控

震撼来袭！Stability AI的SD3.5L新增三大 ControlNet功能生图能力再升级

Stability AI 正式发布了新版 Stable Diffusion3.5 Large，并新增了三种 ControlNet 功能，分别是Blur、Canny和Depth。这一更新为用户提供了更强大的图像生成能力，使得生成的图像更加丰富和多样化。根据 Stability AI 的介绍，这一模型的发布是基于其社区许可协议，允许用户在不商业化的前提下免费使用。无论是个人还是机构，都可以在科学研究等领域使用该模型，而无需支付费用。此外，对于年收入低于100万美元的小型企业和创作者，Stability AI 也允许其在商业用途上免费使用该模型。这种宽松的使用

新视频生成技术AnimateAnything：支持控制镜头轨迹、文本提示等

在视频创作领域，如何实现一致且可控的动画效果一直是研究者们关注的重点。近日，研究团队推出了名为 “AnimateAnything” 的新方法，旨在通过精准的视频操作，使动画创作更加灵活和高效。该技术可以在不同的条件下，如摄像机轨迹、文本提示和用户动作注释等，进行精确的视频处理。“AnimateAnything” 通过设计一种多尺度控制特征融合网络，构建了一个统一的运动表示。这一网络能够将所有控制信息转化为逐帧的光流，从而指导视频的生成。在这个过程中，光流作为运动先验，帮助提

AI新闻资讯

爆火「视频版 ControlNet」开源了！靠提示词精准换画风，全华人团队出品

量子位

相关AI新闻推荐

中国科研团队重磅发布VideoChat-Flash 长视频处理速度提升100倍

以色列科技公司 Lightricks 发布 LTXV！4秒生成一个AI视频

震撼来袭！Stability AI的SD3.5L新增三大 ControlNet功能 生图能力再升级

新视频生成技术AnimateAnything：支持控制镜头轨迹、文本提示等

震撼来袭！Stability AI的SD3.5L新增三大 ControlNet功能生图能力再升级