Stability AI发布单一视频转换多视图视频的生成模型：Stable Video 4D

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Jul 25, 2024

228

近日，Stability AI公司宣布推出一项革命性的视频处理技术——Stable Video4D。该技术能够将单一视角的视频转换成8个不同角度的新视角视频，为创作者提供了前所未有的灵活性和创造力。

Stable Video4D建立在该公司此前推出的Stable Video Diffusion模型基础之上。与将图像转换为视频不同，新模型可以接收视频输入，并生成多个新视角的视频输出，实现了从基于图像的视频生成向全3D动态视频合成的重大飞跃。

使用时，用户只需上传一段视频并指定所需的3D摄像机位置，Stable Video4D即可生成8个新视角的视频，为用户提供全方位的多角度视角。目前，该模型可以在大约40秒内生成8个视角的5帧视频，整个4D优化过程约需20-25分钟。

与之前的方法相比，Stable Video4D能够同时生成多个新视角视频，大大提高了空间和时间轴上的一致性。这不仅确保了物体在多个视角和时间戳上的一致性，还实现了更轻量级的4D优化框架。

Stability AI表示，Stable Video4D目前处于研究阶段，未来有望在游戏开发、视频编辑和虚拟现实等领域得到广泛应用。该公司正在积极优化模型，以处理更广泛的真实世界视频。

Stable Video4D现已在Hugging Face平台上开放使用。Stability AI期待通过持续的研究和开发，进一步提升这项技术创建逼真多角度视频的潜力。该公司将继续与研究人员、专家和社区合作，推动技术创新，不断改进模型性能。

模型地址：https://huggingface.co/stabilityai/sv4d

StableVideo4D StabilityAI 视频处理视频生成

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

全新视频生成框架SkyReels-A2发布：可控视频生成技术再创新高度

最近，Skywork AI 的研究团队推出了一种名为 SkyReels-A2的全新视频生成框架，标志着可控视频生成技术的新高度。这个名为 “元素到视频（E2V）” 的框架可以根据文本提示，将各种视觉元素(如角色、物体、背景)合成自然的视频，并且能够与参考图像保持高度一致。SkyReels-A2的核心在于其复杂的数据处理流程。研究团队设计了一条全面的数据构建管道，以生成包含提示、参考图像和视频的三元组，从而为模型训练提供数据支持。其生成过程通过两个分支进行:空间特征分支和语义特征分支。空

2025年4月8号 16:14

870

Runway发布Gen-4 Turbo：AI视频生成速度再创新高

近日，人工智能视频生成领域的领军企业Runway宣布推出其最新模型“Gen-4Turbo”，为AI驱动的视频创作带来了显著的技术升级。据悉，这一版本在生成速度上实现了重大突破，仅需30秒即可生成一段10秒的高质量视频。这一进展不仅提升了创作效率，也进一步巩固了Runway在生成式AI领域的领先地位，为影视制作、广告设计等行业注入了新的活力。Gen-4Turbo是Runway Gen-4系列的最新迭代版本，延续了其前代在图像到视频生成（Image-to-Video）及世界一致性(World Consistency)上的技术优势，同时将速度优化推

2025年4月8号 10:18

900

亚马逊 AI 视频模型 Nova Reel 升级：可生成长达两分钟的视频片段

亚马逊近日对其 AI 视频生成模型 Nova Reel 进行了升级，推出了 Nova Reel1.1版本。这个新版本不仅能够生成长达两分钟的视频片段，还可以制作多镜头视频，使得各个镜头之间的风格保持一致。Nova Reel 于2024年12月首次发布，是亚马逊在生成视频领域的重要尝试。据 AWS 开发倡导者 Elizabeth Fuentes 在一篇博文中透露，用户可以通过提供最长4，000个字符的提示，生成由六秒镜头组成的长视频。新版的 Nova Reel 还引入了一种名为 “Multishot Manual” 的新模式。在这种模式下，用户可以提供图像和文本提

2025年4月8号 9:27

1.4k

阿里推出OmniTalker：AI视频生成技术再突破，单参考视频实现风格化语音与表情同步

近日，阿里巴巴旗下研发团队发布了一项名为“OmniTalker”的全新AI技术项目，该项目凭借其惊艳的视频生成能力迅速引发业界关注。据悉，OmniTalker仅需一段参考视频，便能精准捕捉视频中人物的语音风格与面部表情，并以此为基础生成唇形同步、表情自然的动态视频。这一技术的亮相，不仅展现了阿里在生成式AI领域的深厚实力，也为视频内容创作带来了革命性的可能性。OmniTalker的核心优势在于其“零样本学习”能力。传统AI视频生成技术往往需要大量训练数据、复杂的模型调参或专业配

2025年4月7号 17:40

3.9k

Luma推出Ray2相机运动概念功能：AI视频迈向电影级镜头控制新境界

近日，人工智能视频生成领域的先锋企业Luma宣布，其旗舰模型Ray2迎来了一项重大功能更新——“相机运动概念”（Camera Motion Concepts）。这一功能通过引入20多种经过精确调校的摄像机运动模式，为AI生成的视频赋予了专业电影级的镜头表现力。这一创新不仅提升了视频创作的艺术性与精确性，也为广告制作、影视预览等领域带来了全新的可能性，标志着AI视频技术向更高层次迈进。据介绍，Ray2的相机运动概念功能涵盖了多种经典与现代的镜头运动方式，包括推进/拉远（Zoom/Push）、左右环

2025年4月7号 10:06

1.8k

字节跳动推出DreamActor-M1：实现Runway Act 功能，挑战动画生成新高度

近日，字节跳动（ByteDance）正式公布了其最新AI项目“DreamActor-M1”，一项旨在革新视频生成技术的前沿成果。这款模型通过结合一张静态照片和一段参考动作视频，能够将照片中的人物无缝替换到视频场景中，生成表情细腻、动作自然且画质高清的动态影像。这一技术的亮相，不仅标志着字节跳动在生成式AI领域的又一次突破，也被视为对现有动画生成工具(如Runway的Act-One)的有力挑战。DreamActor-M1的核心创新在于其对细节的精准把控和一致性表现。传统图像到视频的生成方法往往面临诸多难

2025年4月3号 18:03

4.1k

字节跳动推出DreamActor-M1项目，挑战Runway Act-One的AI角色表演技术

字节跳动近日推出其全新AI项目DreamActor-M1，该项目旨在实现类似Runway Act-One的功能，通过先进的生成式AI技术，将视频中的角色表演转化为虚拟动画，展现出更高的精确度和表现力。这一消息迅速引发了业界和网友的广泛关注，被视为字节跳动在AI视频生成领域迈出的又一大步。技术突破:超越Runway Act-One的野心据公开信息显示，DreamActor-M1的核心目标是捕捉演员的面部表情、动作节奏以及情感细节，并将其无缝转移到任意虚拟角色上。与Runway的Act-One类似，该技术允许用户仅通过上传一段表演

2025年4月3号 15:11

5.1k

AI日报：Runway发布新视频模型Gen-4；宇树G1直播5分钟带货破百万；OpenAI将开源新模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、Runway惊艳发布AI视频生成模型Gen-4，角色场景一致性强到离谱Runway最近推出的Gen-4人工智能模型在媒体生成领域引起了广泛关注。尽管X在过去经历了波动，但近期因与GrokAI的整合和利润率改善逐渐回暖，用户也在回流。

2025年4月1号 15:30

8.4k

Higgsfield AI 发布全新视频模型：电影级相机控制重塑创意边界

近日，Higgsfield AI 发布了其全新的生成式视频模型，引发了广泛关注。这一创新模型以其卓越的专业级相机控制、世界建模能力以及电影化的表现力脱颖而出，为AI视频生成领域注入了新的活力。Higgsfield AI 官方宣布，这一模型名为“DoP I2V-01-preview”，其设计灵感来源于对电影摄影艺术的深度理解，旨在为创作者提供前所未有的精准度和真实感。新模型最引人注目的特点之一是其预设相机模式，这些模式赋予了AI视频前所未有的“灵魂”。从单一图像出发，用户可以轻松实现“子弹时间”运

2025年4月1号 9:58

3.2k

OpenAI因用户激增暂停Sora新用户视频生成功能

近日，OpenAI 刚推出的图像生成功能引发了广泛关注，随之而来的便是用户数量的激增和流量压力的骤升。为了解决这一问题，OpenAI 宣布暂时禁用新用户的 Sora 视频生成功能。该决策旨在确保平台的稳定性和现有用户的使用体验。OpenAI 在其支持页面上发布了通知，明确表示:“由于当前面临高流量压力，Sora 的新用户视频生成功能将暂时不可用。如果您是首次登录 Sora 的用户，您依然可以使用图像生成功能。” 这一举措显然是为了缓解服务器负担，确保所有用户能够顺畅地享受服务。图源备

2025年4月1号 9:19

1.3k

AI资讯

AI日报

AI时间线

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图