豆包视频模型PixelDance发布后OpenAI急了？宣称对Sora进行重大升级

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年9月26号 10:57

191

OpenAI 近日在视频 AI 领域再次引发轰动，他们正在对今年2月发布的 Sora 进行重大升级。根据《信息日报》的报道，这次升级的核心目标是显著提升 Sora 的性能，使其能够更快速地生成更长、更高质量的视频内容。

回顾 Sora 初版的表现，确实存在不少亟待解决的问题。最初版本生成一段视频需要耗时超过10分钟，这样的效率显然无法满足实际应用需求。更严重的是，许多电影制作者对 Sora 的输出质量颇有微词。

制片人 Patrick Cederberg 的经历就是一个典型案例:为了获得一个可用的视频，他不得不生成上百个片段。Sora 在保持风格、物体和角色一致性方面的表现欠佳，物理错误频出，这些问题严重影响了其实用性。

元宇宙科幻赛博朋克大模型 (2)绘画

图源备注：图片由AI生成，图片授权服务商Midjourney

然而，这些挑战在视频 AI 领域并非罕见。新版 Sora 的开发正是针对这些问题展开的。为了全面提升系统性能，OpenAI 正在收集数百万小时的高分辨率视频作为训练素材，涵盖多种风格和主题，旨在减少模型的偏差，提高输出质量。

值得注意的是，自 Sora 发布以来，视频 AI 市场的竞争态势日益激烈。中国市场相继推出了可灵、Vidu、即梦 AI 和 MiniMax 四个新系统。与此同时，Runway ML 也不甘落后，推出了两个新的 AI 模型，并刚刚宣布与 Lionsgate 达成合作。这种竞争态势无疑将推动整个行业的快速发展。

尽管 OpenAI 在今年9月初向 CNBC 表示，Sora 仍处于研究阶段，需要与政策制定者进行深入讨论，但公司 CTO Mira Murati 在3月中旬却表现出十足的信心。她明确表示，Sora 必将在今年内正式发布。不过，Murati 也坦言，目前的系统运行成本过高，被形容为 "奢侈品中的奢侈品"，因此降低生成成本也是 OpenAI 的一个重要任务。

Sora 的这次升级无疑是一次充满挑战和机遇的旅程。它不仅要解决技术层面的问题，还需要在效率、成本和质量之间寻找平衡。如果 OpenAI 能够成功克服这些障碍，Sora 很可能会成为视频制作行业的一个重要变革力量。

随着 AI 技术在视频领域的不断深入，我们可以预见，未来的视频创作将变得更加高效和多样化。这不仅会为专业制作者提供新的工具，也可能为普通用户开启视频创作的新天地。尽管目前 Sora 还面临着诸多挑战，但它的发展方向无疑代表了视频 AI 的未来趋势。

OpenAI 在全球扩展人工智能代理服务Operator，提升用户体验

OpenAI 于上周五宣布，正在为澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国、英国等多个国家的 ChatGPT Pro 用户推出其最新的人工智能代理工具 ——Operator。这一工具的推出标志着 OpenAI 在人工智能领域的一次重要扩展，旨在帮助用户更高效地完成各种日常任务。Operator 自今年1月在美国首次推出以来，便备受关注，成为市场上少数能够代表用户执行任务的 “人工智能代理” 之一。它能够完成多种操作，包括订票、预订餐厅、提交费用报告，甚至在电子商务网站上购物。这些功能不仅

OpenAI宣布面向多个国家推出AI代理 Operator

OpenAI 于周五宣布，将在包括澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国和英国等多个国家，为 ChatGPT Pro 用户推出一款名为 “Operator” 的人工智能代理工具。此工具旨在帮助用户更高效地完成各类任务，包括订票、预订餐厅、提交费用报告和网上购物等。“Operator” 最初于今年1月在美国推出，作为市场上几款 “人工智能代理” 工具之一，OpenAI 希望通过这一产品，为用户提供更便捷的服务。需要注意的是，这一工具目前仅对每月付费200美元的 ChatGPT Pro 用户开放，用户可以通过

微软备战OpenAI的GPT-5模型，预计即将发布GPT-4.5

近日，有消息人士透露，微软正在积极准备即将发布的 OpenAI 新模型 ——GPT-4.5及 GPT-5。根据 OpenAI 首席执行官山姆・阿特曼的说法，GPT-4.5将在数周内正式推出，微软则预计最早将在下周托管这一新 AI 模型。GPT-4.5代号 “猎户座”，是 OpenAI 的下一代模型，并且是公司最后一个非链式思维（non-chain-of-thought）模型。业内人士指出，GPT-4.5的能力有望大幅超越其前任 GPT-4。图源备注：图片由AI生成，图片授权服务商Midjourney不过，眼下的焦点不仅仅停留在 GPT-4.5，微软也在期待 GPT-5的到来。根据消

OpenAI Operator工具向多国Pro用户推出欧洲地区推广仍在进行

北京时间，2025 年 2 月 21日讯：OpenAI 今日宣布，其人工智能工具 Operator 已正式向澳大利亚、巴西、加拿大、印度、日本、新加坡、韩国、英国以及 ChatGPT 可用的多数地区的 Pro 用户推出。这一消息通过 X 平台发布，标志着 Operator 的全球化推广迈出重要一步。然而，欧盟、瑞士、挪威、列支敦士登和冰岛的推广工作仍在进行中，具体进展有待后续更新。Operator 扩展至多国Operator 是 OpenAI 开发的一款 AI 代理工具，能够通过视觉界面控制浏览器，自主完成订票、购物等网络任务。该工具最初于

AI新闻资讯