全新视频生成模型Magic 1-For-1：在一分钟内生成一分钟长度视频

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2025年2月13号 10:08

512

近日，DA-Group-PKU 团队推出了一个名为 “Magic1-For-1” 的全新视频生成模型，该模型以高效的图像到视频生成技术著称，能够在短短一分钟内生成一段一分钟长的视频剪辑。此技术通过优化内存使用和减少推理延迟，极大提升了视频生成的效率。

Magic1-For-1模型将视频生成任务分解为两个关键的子任务:文本到图像的生成和图像到视频的生成。通过这样的分解，团队不仅提高了训练的效率，还实现了更为精确的视频生成效果。这个模型的发布，不仅为相关领域的研究提供了新的工具，也为开发者和研究者打开了更多的可能性。

在技术发布的同时，团队还提供了相应的技术报告、模型权重和代码，供有兴趣的用户下载和使用。他们鼓励更多的开发者和研究者参与到该项目中，共同推动交互式视频生成技术的进步。为了方便用户使用，团队提供了详细的环境设置指南，包括如何创建合适的 Python 环境及安装所需的依赖库。

此外，Magic1-For-1还支持多种推理模式，包括单 GPU 和多 GPU 的设置，使得用户能够根据自己的设备条件灵活选择最适合的生成方式。用户只需简单几步就能完成模型的搭建和运行，甚至可以通过量化技术进一步优化推理速度。

这项技术的推出标志着图像到视频生成领域的一次重要进展，未来的发展潜力巨大，DA-Group-PKU 团队表示将持续致力于优化和扩展该技术的应用，期待更多人能够加入到这个激动人心的研究领域中。

项目：https://github.com/DA-Group-PKU/Magic-1-For-1

划重点:
📹 ** 高效生成 **:Magic1-For-1模型能在一分钟内生成一段一分钟的视频，优化了内存使用并减少了推理延迟。
📥 ** 开放资源 **:团队已发布技术报告、模型权重和代码，欢迎开发者和研究者参与贡献。
💻 ** 灵活推理 **:支持单 GPU 和多 GPU 推理设置，用户可根据需求选择适合的运行模式。

原字节跳动AI高管骆怡航加入生数科技任CEO 推进AI视频生成商业化

据凤凰科技报道，骆怡航近日正式加入生数科技担任CEO，全面负责公司研发、产品、商业化及团队管理。作为清华大学自动化系博士，他在云计算及AI领域深耕十余年，拥有深厚的技术背景和商业化经验。在加入生数科技前，骆怡航担任字节跳动火山引擎AI应用产品线负责人，直接汇报火山引擎总裁。据透露，该产品线由他从零组建，覆盖多个AI相关产品，管理规模数百人。此前，他还参与了字节跳动早期的AI中台规划与建设。业内人士评价，骆怡航在AI技术规划、产品规划、商业拓展及团队

华为昇腾携手阶跃星辰推出开源多模态模型，进军 AI 新领域

近日，魔乐社区（Modelers）正式上线了由阶跃星辰研发的 Step-Video 和 Step-Audio 两款开源多模态大模型。这两款模型分别用于视频生成和语音交互，旨在为开发者和企业用户提供更强大的 AI 工具。Step-Video 模型的全名为 Step-Video-T2V，这是一款参数量高达300亿的全球最大开源视频生成模型。该模型能够直接生成204帧、540P 分辨率的高质量视频，并在指令遵循、运动平滑性、物理合理性以及美感等方面，表现超越了市场上现有的顶尖开源视频模型。另一方面，Step-Audio 则是业内首款能够生成多种情

AI数字人新突破！Hedra推出Character-3模型和Hedra Studio：对图像、文本和音频进行联合推理

根据Hedra 在X平台上的最新消息，Hedra Studio正式推出了其全新AI模型——Character-3，这一模型被认为是数字人视频生成技术的一次重大飞跃。Hedra通过整合尖端AI技术，为内容创作者和企业营销人员提供了更高效、更具创意的内容生成工具，标志着AI驱动的叙事方式迈向了新的高度。Character- 3 模型：多模态融合的创新Character- 3 模型具备同时处理多种输入类型的能力，包括图像、文本和音频，并能将这些元素无缝融合，生成高质量的视频内容。用户只需上传一张人物照片，输入一段文本或音频，

阿里的AI视频模型通义万相Wan推出独立网站

阿里巴巴旗下“通义”品牌宣布，其AI视频生成模型“通义万相Wan”正式推出独立网站，标志着其生成式AI技术的重大进展。新网站现已开放，用户可直接登录体验“文本生成视频”和“图像生成视频”功能，无需本地部署，极大降低了使用门槛。此外，每天登录网站还可获赠积分，激励用户持续探索。“通义万象Wan”自2023年7月亮相以来不断优化，其最新版本Wan2.1在VBench排行榜上以84.7%的得分位居首位，擅长动态场景和多对象交互。依托阿里云自研的扩散变换器（DiT）架构，该模型支持中