阶跃星辰视频生成模型Step-Video V2版发布支持精准生成基础文字

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Jan 23, 2025

315

2025年1月22日，上海阶跃星辰智能科技有限公司宣布其视频生成模型 Step-Video 正式升级至 V2版本。此次升级带来了显著的技术突破和功能提升，使其在真实世界模拟方面更加强大。

Step-Video V2版本在多个核心技术领域进行了优化和创新。首先，该版本采用了压缩比更高的 VAE 模型，通过空间和时间的高效压缩，在保证重构质量的同时，显著降低了计算复杂度，提升了生成效率。其次，Step-Video V2对 DiT 架构进行了深度优化，并引入强化学习算法，进一步提升了视频生成的流畅性和细节表现力。此外，该版本还结合了自研的多模态理解大模型和视频知识库，能够更精准地描述视频内容和镜头语言，生成更贴近真实世界的视频。

微信截图_20250123090916.png

在实际应用中，Step-Video V2展现出了强大的复杂运动生成能力，无论是芭蕾舞、空手道，还是羽毛球等场景，都能流畅地呈现动态画面。同时，该模型在人物表情捕捉方面表现出色，能够细腻地呈现真实人物或虚构角色的神态和光影效果。此外，Step-Video V2还支持丰富的镜头语言，包括推、拉、摇、移等多种运动方式，以及不同景别之间的切换，为视频创作提供了更多可能性。

值得一提的是，Step-Video V2新增了基础文字生成功能，能够将文字自然融入视频内容，生成效果显著优于前代模型。这一功能的加入，进一步拓展了视频生成的应用场景。

目前，Step-Video V2已在跃问网页端（https://yuewen.cn/videos）开放试用申请，用户可以体验这一升级后的强大功能。

此次升级不仅标志着阶跃星辰在视频生成领域的技术进步，也为创作者提供了更强大的工具，推动视频创作进入新的阶段。

Step-Video V2版本智能科技视频生成

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

Higgsfield AI 发布全新视频模型：电影级相机控制重塑创意边界

近日，Higgsfield AI 发布了其全新的生成式视频模型，引发了广泛关注。这一创新模型以其卓越的专业级相机控制、世界建模能力以及电影化的表现力脱颖而出，为AI视频生成领域注入了新的活力。Higgsfield AI 官方宣布，这一模型名为“DoP I2V-01-preview”，其设计灵感来源于对电影摄影艺术的深度理解，旨在为创作者提供前所未有的精准度和真实感。新模型最引人注目的特点之一是其预设相机模式，这些模式赋予了AI视频前所未有的“灵魂”。从单一图像出发，用户可以轻松实现“子弹时间”运

2025年4月1号 9:58

220

OpenAI因用户激增暂停Sora新用户视频生成功能

近日，OpenAI 刚推出的图像生成功能引发了广泛关注，随之而来的便是用户数量的激增和流量压力的骤升。为了解决这一问题，OpenAI 宣布暂时禁用新用户的 Sora 视频生成功能。该决策旨在确保平台的稳定性和现有用户的使用体验。OpenAI 在其支持页面上发布了通知，明确表示:“由于当前面临高流量压力，Sora 的新用户视频生成功能将暂时不可用。如果您是首次登录 Sora 的用户，您依然可以使用图像生成功能。” 这一举措显然是为了缓解服务器负担，确保所有用户能够顺畅地享受服务。图源备

2025年4月1号 9:19

730

Runway惊艳发布AI 视频生成模型Gen-4 ，角色场景一致性强到离谱

备受瞩目的 AI 研究公司 Runway 近日隆重推出其下一代人工智能模型系列—— Runway Gen-4。本次发布的 Gen-4模型专注于媒体生成和世界一致性，旨在为用户带来前所未有的创作自由和控制力。其中，最引人瞩目的功能便是其能够精确地生成并保持角色、场景和物体在不同镜头中的高度一致性。告别“换脸”烦恼:角色一致性轻松实现以往的 AI 视频生成模型常常面临角色在不同场景中形象不统一的问题，这给叙事创作带来了诸多挑战。Runway Gen-4革命性地解决了这一痛点。用户只需提供单个角色参

2025年4月1号 9:03

1.4k

OpenAI 视频生成工具 Sora 遭曝光：种族与性别偏见问题凸显

近年来，生成式人工智能（AI）技术的迅猛发展改变了数字内容创作的面貌，但偏见问题始终伴随其中。最近，《连线》杂志对 OpenAI 旗下的视频生成工具 Sora 进行了深入调查，结果发现该工具在生成视频时常常会强化种族、性别和能力方面的刻板印象，甚至有时忽视了对某些群体的表现。图源备注：图片由AI生成，图片授权服务商Midjourney在调查中，研究人员给 Sora 提供了25个基本的提示，例如 “一个人走路” 或 “飞行员” 等职位名称，同时也包含一些身份特征的描述，比如 “残疾人”

2025年3月31号 9:07

2.0k

PIKA新功能发布：AI视频技术“让您遇见更年轻的自己”

随着人工智能技术的迅猛发展，AI视频生成平台iPIKA近日推出了一项引人注目的新功能——“您可以遇见更年轻的自己”。这一功能自上线以来迅速引发热议，成为科技与情感结合的又一创新案例。iPIKA的新功能允许用户通过上传一张童年照片和一段自拍视频，生成一段与“更年轻的自己”互动的虚拟视频。具体操作流程为:用户拍摄一段自拍视频，确保画面留出半边空间（自己位于左侧或右侧），然后上传一张小时候的照片。通过简单的文字提示，用户可以自定义“年轻版自己”的动作和表

2025年3月28号 10:00

2.1k

合成数据立功！AccVideo实现高质量视频生成、速度飙升8. 5倍、

在人工智能视频生成领域，扩散模型以其卓越的性能备受瞩目。然而，其固有的迭代去噪特性导致生成过程耗时且计算成本高昂，成为制约其广泛应用的关键瓶颈。近日，来自B北京航空大学、香港大学和上海人工智能实验室的研究团队联合发布了一项名为 AccVideo 的创新技术。该方法通过一种新颖高效的蒸馏方法，并结合合成数据集，成功将视频扩散模型的生成速度提升了惊人的8.5倍。现有的视频扩散模型在生成高质量视频方面表现出色，但其迭代式的去噪过程需要大量的推理步骤。这意

2025年3月27号 11:11

3.0k

零成本拍爆款！AI电商视频生成神器Product Anyshoot来了转化率飙升300%

随着电子商务的迅猛发展，如何高效、真实地展示商品成为商家面临的重要课题。近日，一款名为Product Anyshoot的AI视频生成工具引发行业关注。这款工具凭借其独特的功能和出色的商品还原能力，被誉为“电商视频生成神器”，有望彻底改变传统商品展示视频的制作方式。据介绍，Product Anyshoot的核心优势在于其强大的商品“传送”能力。商家只需上传一张商品图片，系统便能智能识别并将该商品无缝融入预制视频中，让虚拟模特自然地手持、穿戴甚至摆放商品。无论是将项链挂在模特颈部

2025年3月26号 15:03

6.7k

清华大学开源 Video-T1：无需重新训练 AI视频秒变高清大片

近日，清华大学的研究团队开源了其最新的研究成果——Video-T1。这项技术的核心在于测试时缩放（Test-Time Scaling， TTS），旨在通过在视频生成过程的推理阶段投入更多的计算资源，显著提升生成视频的质量和与文本提示的一致性，而无需重新进行昂贵的模型训练。这一创新性的方法为视频生成领域带来了新的可能性。何为“测试时缩放”?在大型语言模型（LLMs）领域，研究人员已经发现，通过在测试阶段增加计算量可以有效提升模型性能。Video-T1借鉴了这一思路，并将其应用于视频生成

2025年3月26号 14:30

4.4k

可灵AI营收超1亿收入主要来自于C端订阅服务

在人工智能领域，快手推出的可灵 AI 正在逐步崭露头角，成为视频生成应用中的一匹黑马。根据最新的业绩电话会，快手创始人兼 CEO 程一笑透露，自去年6月推出以来，可灵 AI 的营业收入已超过1亿元，成为国内视频生成 AI 应用中最具规模的商业化产品。可灵 AI 以其强大的功能和较早的市场布局，在竞争激烈的 AI 市场中占据了一席之地。程一笑强调，随着 AI 技术的不断进步，市场也会经历周期性波动。快手选择依托 AI 技术对现有业务进行升级，以实现研发与收益的良性循环。这种思路

2025年3月26号 10:56

1.3k

快手发布财报：All in视频大模型可灵AI商业化首战告捷

3月25日，快手发布2024年全年业绩，总营收同比增长11.8%至1269亿元，经调整净利润达177亿元，同比大幅增长72.5%。财报亮点在于，其于去年6月推出的视频生成大模型“可灵AI”商业化进展迅速，截至今年2月累计营收已超1亿元。可灵AI面向C端推出会员收费模式，并与数千家B端企业建立API订阅合作。快手CEO程一笑在财报电话会上透露，可灵AI服务用户已超500万，单月流水过千万，预计2025年将大幅增长。程一笑强调，快手正处于AI技术重塑产业格局的关键节点，AI不仅提升效率，更是驱动平台增长

2025年3月26号 10:43

1.9k

AI资讯

AI日报

AI时间线

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图

阶跃星辰视频生成模型Step-Video V2版发布 支持精准生成基础文字