会员免费试用！OpenAI视频生成模型Sora Turbo上线：最高支持20秒1080P视频

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年12月10号 7:51

442

OpenAI在今日的直播中发布了备受期待的产品——Sora Turbo，标志着2024年生成式AI领域的一大突破。Sora Turbo的生成效率显著提升，能够通过文本直接生成最多20秒的1080P视频，成为目前全球生成时长最高的视频模型之一。该模型支持文本加图片或视频的输入，生成特定视频内容，使生成效果更加可控。

Sora Turbo的技术亮点包括超分、超帧和HDR游戏阵容的全游戏支持，以及两个基于独显的自研功能升级。其中，触控动态插帧功能可以显著提升插帧准确性，减少画面破损;游戏暗夜模式则通过AI算法提升暗部细节，增强暗部可视效果，同时解决了暗光环境下玩游戏的亮度问题。

微信截图_20241210074540.png

目前，Sora已进入无限制使用阶段，对于ChatGPT Plus和Pro会员来说，使用Sora无需额外费用，这一政策被认为非常良心。OpenAI还开发了全新UI，并提供社区分享服务，允许用户分享自己生成的视频，或借鉴他人的提示效果来完善自己的作品。

Sora的技术原理包括对Patch的应用，允许在大量图像和视频数据上进行密集训练，以及视频压缩网络的应用，降低视觉数据维度，提高输出质量。

Sora还融合了扩散模型与Transformer架构，采用创新的扩散式转换器方法，取代了传统的U-Net架构，有效提升了对输入图像与文本标签之间分布关系的捕捉能力。此外，Sora引入了DALL・E3的重新字幕技术，通过训练具备高度描述性的字幕模型，为训练集中的所有视频创建文本字幕，提升文本的保真度和视频的整体质量。

体验地址：https://sora.com/

AI在这方面存在致命缺陷！专家：AI不应用于重要应用

在当前的技术环境下，人工智能（AI）引发了广泛的讨论。德蒙特福特大学的网络安全教授 Eerke Boiten 对此表示，现有的 AI 系统在管理和可靠性方面存在根本性缺陷，因此不应被用于重要应用。Boiten 教授指出，当前的 AI 系统大多依赖于大型神经网络，尤其是生成式 AI 和大型语言模型（如 ChatGPT）。这些系统的工作原理相对复杂，尽管每个神经元的行为是由精确的数学公式决定的，但整体行为却是不可预测的，这种 “涌现” 特性使得系统难以进行有效的管理与验证。图源备注：图片由AI生

Pipeshift推出模块化推理引擎，实现AI推理GPU使用率降低75%

近日，初创公司 Pipeshift 推出了一款全新的端到端平台，旨在帮助企业更高效地训练、部署和扩展开源生成式 AI 模型。该平台不仅可以在任何云环境或本地 GPU 上运行，还能够显著提升推理速度和降低成本。随着 AI 技术的迅猛发展，许多企业面临着如何在多种模型之间高效切换的挑战。传统上，团队需要构建一个复杂的 MLOps 系统，涉及计算资源的获取、模型训练、精调以及生产级部署等多个环节，这不仅需要花费大量的时间和工程资源，还可能导致基础设施的管理成本不断增加。Pipeshift

Meta首席AI科学家预测五年内将出现新的AI架构范式，开启 “机器人十年”

在日前的达沃斯 “技术辩论” 会上，Meta 的首席 AI 科学家 Yann LeCun 对未来五年的人工智能发展做出了激动人心的预测。他认为，现有的人工智能系统将在未来3到5年内面临巨大的变革，将出现一种 “新的 AI 架构范式”，超越当今普遍使用的生成式 AI 和大型语言模型（LLM）的能力。LeCun 指出，当前的 LLM 虽然在语言处理上表现良好，但在真正智能的行为上却存在显著局限性。他认为，这些局限性主要体现在以下四个方面:对物理世界缺乏理解、缺乏持久的记忆、缺乏推理能力以及缺乏复杂的

甲骨文推出新AI智能体和生成式AI功能，助力销售团队提升客户互动

在最近举行的甲骨文云世界巡回展上，甲骨文宣布了在其 Oracle Fusion Cloud Sales 中推出新的 AI 代理和生成式 AI 功能。这些新功能旨在帮助销售团队更有效地与客户互动，加快销售流程，提高工作效率。图源备注:图片由AI生成，图片授权服务商Midjourney新推出的 AI 功能是 Oracle Fusion Cloud 客户体验（CX）的一部分，利用来自财务和供应链的连接数据，帮助销售团队为每个客户提供个性化和相关性强的体验。通过这些 AI 代理，销售人员能够节省时间，将更多精力投入到与客户建立关系上。其中，客