效果最佳！阶跃星辰开源Step-Video-T2V 视频生成模型

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Feb 18, 2025

430

今日，阶跃星辰与吉利汽车集团宣布，联合开源两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。

其中，阶跃Step-Video-T2V视频生成模型在参数量和性能上均处于全球领先水平。该模型拥有300亿参数量，能够直接生成204帧、540P分辨率的高质量视频，确保生成内容信息密度高、一致性强。评测结果显示，Step-Video-T2V在指令遵循、运动平滑性、物理合理性、美感度等方面均表现出色，显著超越市面上既有的最佳开源视频模型。

微信截图_20250218085337.png

目前，这两款模型均已在跃问App内上线，供开发者朋友们体验并提供宝贵建议。

阶跃Step-Video-T2V视频生成模型在复杂运动、美感人物、视觉想象力等方面展现出卓越的生成能力。它能够精准理解指令，高效助力视频创作者实现创意呈现。无论是高雅优美的芭蕾舞、对抗激烈的空手道，还是紧张刺激的羽毛球、高速翻转的跳水，Step-Video-T2V都能生成真实且符合物理规律的画面。

同时，它还支持多种镜头运动方式和景别切换，能够生成大幅度运镜的视觉效果。生成的人物形象则更加逼真、生动，细节丰富，表情自然。

GitHub:

https://github.com/stepfun-ai/Step-Audio

Hugging Face:

https://huggingface.co/collections/stepfun-ai/step-audio-67b33accf45735bb21131b0b

技术报告:

https://github.com/stepfun-ai/Step-Audio/blob/main/assets/Step-Audio.pdf

阶跃星辰 Step-Video-T2V 吉利汽车多模态大模型

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

AI日报：OpenAI推出史上最贵o1-pro API；腾讯混元全新推理模型T1将发布；阶跃星辰Step-Video-TI2V视频模型开源

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、最贵！用户可以通过窗口前端的图标直接调用Gemini助手，享受自定义快捷键和系统托盘图标的支持，尽管目前不支持侧边栏固定模式。

2025年3月20号 15:25

440

运动可控！阶跃星辰 Step-Video-TI2V 图生视频模型开源

上海阶跃星辰智能科技有限公司宣布开源其最新的图生视频模型——Step-Video-TI2V。这一模型是基于30B参数的Step-Video-T2V训练而成，能够生成102帧、5秒、540P分辨率的视频，具有运动幅度可控和镜头运动可控两大核心特点，尤其在动漫效果方面表现出色。

2025年3月20号 14:32

3.5k

百度发布文心4.5与X1大模型，价格大幅降低引关注

近日，百度正式推出其最新的文心大模型4.5及文心大模型 X1，用户可在文心一言官网免费体验这两款先进的模型。文心4.5是百度首个原生多模态大模型，专注于多模态理解和逻辑推理，其性能在多项基准测试中超越了 GPT-4.5，API 调用价格仅为后者的1%。这一显著的价格优势，无疑会吸引更多开发者和企业的关注。文心大模型4.5在多模态理解方面取得了显著进展，具备了图形推理、图表分析、甚至对梗图、漫画、歌曲和电影的理解能力。在多个测试中，文心4.5的平均分达到了79.6，超过了 GPT-

2025年3月17号 10:35

3.5k

阶跃星辰与智元机器人达成合作探索大模型+具身机器人应用

上海阶跃星辰智能科技有限公司与智元机器人正式签署深度战略合作协议，双方将在基座大模型和机器人研发领域展开深度合作，共同探索“大模型+具身机器人”的技术突破与应用创新。此次合作涉及世界模型技术研发、具身智能领域数据合作以及新零售等应用场景的落地，旨在推动具身智能技术在家庭服务、新零售、智能制造等领域的规模化应用。

2025年3月13号 17:31

1.7k

百万成本揭秘LLM训练黄金法则，阶跃星辰推出全领域适用的超参数优化工具

在人工智能的激烈竞争中，一场耗资百万美元的大规模实验正悄然改变着大语言模型的训练方式。阶跃星辰研究团队日前发布重磅研究成果，他们通过耗费近100万NVIDIA H800GPU小时的算力，从零开始训练了3，700个不同规模的模型，累计训练了惊人的100万亿个token，揭示出一条被称为"Step Law"的普适性缩放规律，为大语言模型的高效训练提供了全新指南。这项研究不仅仅是对超参数优化的探索，更是第一个全面考察模型最优超参在不同形状、稀疏度和数据分布下稳定性的工作。研究结果表明，无

2025年3月13号 15:41

1.6k

AI日报：重磅！阿里新夸克升级为“AI超级框”；谷歌开源多模态模型Gemma-3；潞晨科技开源视频大模型Open-Sora 2.0

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、阿里巴巴推出AI旗舰应用“新夸克”全面升级为“AI超级框”阿里巴巴于3月13日推出了其全新升级的AI旗舰应用——新夸克。预计到2025年，智谱将推出多款开源大模型，助力AI行业的发展，同时推动珠海的AI产业生态建设。

2025年3月13号 15:22

900

阿里巴巴推出AI旗舰应用“新夸克” 全面升级为“AI超级框”

阿里巴巴宣布推出AI旗舰应用——新夸克。新夸克基于阿里通义领先的推理及多模态大模型，全面升级为一个无边界的“AI超级框”。“新夸克” 不仅具备强大的推理能力，还能够实现多模态的交互，用户在使用过程中可以与 AI 进行实时互动。AI 将根据用户的需求进行思考与执行，并在此过程中不断调整策略，以确保最终任务的顺利完成。这一创新的设计使得用户在享受便捷的同时，也能感受到与 AI 的紧密连接。阿里巴巴表示，新夸克将告别传统搜索，升级为一个All in One的“AI超级框”，

2025年3月13号 13:53

3.4k

阿里巴巴推出AI旗舰应用“新夸克” 全面升级为“AI超级框”

3月13日，阿里巴巴正式推出其AI旗舰应用——新夸克。这款全新升级的夸克基于阿里通义领先的推理及多模态大模型，打造了一个无边界的“AI超级框”，为用户带来全新的AI体验。

2025年3月13号 11:29

3.3k

谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

谷歌 CEO 桑达尔・皮查伊（Sundar Pichai）在一场发布会上宣布，谷歌开源了最新的多模态大模型 Gemma-3，该模型以低成本、高性能为特点，备受关注。Gemma-3提供了四种不同参数规模的选项，分别为10亿、40亿、120亿和270亿参数。令人惊讶的是，最大参数的270亿模型只需一张 H100显卡即可高效推理，而同类模型往往需要十倍的算力，这使 Gemma-3成为目前算力要求最低的高性能模型之一。根据最新的测试数据，Gemma-3在各类对话模型的评比中表现不俗，仅次于知名的 DeepSeek 模型，超越了 OpenAI 的 o3-m

2025年3月13号 8:52

2.1k

华为昇腾携手阶跃星辰推出开源多模态模型，进军 AI 新领域

近日，魔乐社区（Modelers）正式上线了由阶跃星辰研发的 Step-Video 和 Step-Audio 两款开源多模态大模型。这两款模型分别用于视频生成和语音交互，旨在为开发者和企业用户提供更强大的 AI 工具。Step-Video 模型的全名为 Step-Video-T2V，这是一款参数量高达300亿的全球最大开源视频生成模型。该模型能够直接生成204帧、540P 分辨率的高质量视频，并在指令遵循、运动平滑性、物理合理性以及美感等方面，表现超越了市场上现有的顶尖开源视频模型。另一方面，Step-Audio 则是业内首款能够生成多种情

2025年3月10号 16:04

2.4k

AI资讯

AI日报

AI时间线

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图

效果最佳！阶跃星辰开源Step-Video-T2V 视频生成模型

AIbase基地

本文来自AIbase日报

相关AI新闻推荐

AI日报：OpenAI推出史上最贵o1-pro API；腾讯混元全新推理模型T1将发布；阶跃星辰Step-Video-TI2V视频模型开源

运动可控！阶跃星辰 Step-Video-TI2V 图生视频模型开源

百度发布文心4.5与X1大模型，价格大幅降低引关注

阶跃星辰与智元机器人达成合作 探索大模型+具身机器人应用

百万成本揭秘LLM训练黄金法则，阶跃星辰推出全领域适用的超参数优化工具

AI日报：重磅！阿里新夸克升级为“AI超级框”；谷歌开源多模态模型Gemma-3；潞晨科技开源视频大模型Open-Sora 2.0

阿里巴巴推出AI旗舰应用“新夸克” 全面升级为“AI超级框”

阿里巴巴推出AI旗舰应用“新夸克” 全面升级为“AI超级框”

​谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍

华为昇腾携手阶跃星辰推出开源多模态模型，进军 AI 新领域

阶跃星辰与智元机器人达成合作探索大模型+具身机器人应用

谷歌开源新一代多模态模型 Gemma-3：性能卓越、成本降低 10 倍