OpenAI 近日在视频 AI 领域再次引发轰动,他们正在对今年2月发布的 Sora 进行重大升级。根据《信息日报》的报道,这次升级的核心目标是显著提升 Sora 的性能,使其能够更快速地生成更长、更高质量的视频内容。
回顾 Sora 初版的表现,确实存在不少亟待解决的问题。最初版本生成一段视频需要耗时超过10分钟,这样的效率显然无法满足实际应用需求。更严重的是,许多电影制作者对 Sora 的输出质量颇有微词。
制片人 Patrick Cederberg 的经历就是一个典型案例:为了获得一个可用的视频,他不得不生成上百个片段。Sora 在保持风格、物体和角色一致性方面的表现欠佳,物理错误频出,这些问题严重影响了其实用性。
图源备注:图片由AI生成,图片授权服务商Midjourney
然而,这些挑战在视频 AI 领域并非罕见。新版 Sora 的开发正是针对这些问题展开的。为了全面提升系统性能,OpenAI 正在收集数百万小时的高分辨率视频作为训练素材,涵盖多种风格和主题,旨在减少模型的偏差,提高输出质量。
值得注意的是,自 Sora 发布以来,视频 AI 市场的竞争态势日益激烈。中国市场相继推出了 可灵、Vidu、即梦 AI 和 MiniMax 四个新系统。与此同时,Runway ML 也不甘落后,推出了两个新的 AI 模型,并刚刚宣布与 Lionsgate 达成合作。这种竞争态势无疑将推动整个行业的快速发展。
尽管 OpenAI 在今年9月初向 CNBC 表示,Sora 仍处于研究阶段,需要与政策制定者进行深入讨论,但公司 CTO Mira Murati 在3月中旬却表现出十足的信心。她明确表示,Sora 必将在今年内正式发布。不过,Murati 也坦言,目前的系统运行成本过高,被形容为 "奢侈品中的奢侈品",因此降低生成成本也是 OpenAI 的一个重要任务。
Sora 的这次升级无疑是一次充满挑战和机遇的旅程。它不仅要解决技术层面的问题,还需要在效率、成本和质量之间寻找平衡。如果 OpenAI 能够成功克服这些障碍,Sora 很可能会成为视频制作行业的一个重要变革力量。
随着 AI 技术在视频领域的不断深入,我们可以预见,未来的视频创作将变得更加高效和多样化。这不仅会为专业制作者提供新的工具,也可能为普通用户开启视频创作的新天地。尽管目前 Sora 还面临着诸多挑战,但它的发展方向无疑代表了视频 AI 的未来趋势。