0.7MB搞定一帧3D场景！英伟达新AI模型QUEEN AI让自由视角直播成为现实

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年12月10号 11:35

198

在虚拟现实和流媒体领域，英伟达携手马里兰大学带来了一项突破性进展。这个被命名为QUEEN的AI模型，不仅能让观众在体育赛事中随心所欲地切换观赛视角，更能将每帧3D场景压缩至仅0.7MB大小，同时保持惊人的350帧每秒渲染速度。

这项技术的关键在于其独特的处理方式。传统的3D场景重建往往面临着存储空间过大或画质不佳的两难困境，而QUEEN巧妙地解决了这一问题。它采用智能算法专注于捕捉画面中发生变化的部分，对于保持静态的场景元素则进行重复利用，大大提升了计算效率。

英伟达研究主管沙利尼·德梅洛道出了QUEEN的核心优势:"我们创造了一个完美平衡压缩率、视觉质量、编码时间和渲染速度的解决方案。"这种平衡使得近乎实时的自由视点视频传输成为可能。

在技术层面，QUEEN采用了创新的3D高斯飞溅框架，通过学习连续帧之间的高斯属性残差来实现高质量重建。研究团队还开发了量化稀疏框架，结合了专门的latent-decoder和门控模块，进一步优化了数据存储效率。

这项技术的应用前景令人期待:体育爱好者可以在比赛直播中自由选择观赛角度，音乐会观众能够获得身临其境的虚拟现实体验，远程教学时学习者也可以选择最适合自己的视角来学习烹饪或手工艺等技能。在工业领域，它更可以助力仓库的远程操作管理。

如此快速的渲染速度配合出色的视觉效果，QUEEN正在重新定义流媒体体验的未来。这不仅是技术的进步，更是为数字内容创作者和消费者开启了一个充满可能性的新时代。

Nvidia重磅推出三大AI安全工具，以控制AI聊天机器人

近日，Nvidia 宣布在其 NeMo Guardrails 平台上新增三项安全功能，旨在帮助企业更好地管理和控制 AI 聊天机器人。这些微服务专门针对 AI 安全和内容审核中的常见挑战，提供了一系列实用的解决方案。其中，内容安全服务（Content Safety）可以在 AI 响应用户之前，对其内容进行审核，检测是否存在潜在的有害信息。这项服务有助于防止不当内容传播，确保用户得到安全和合适的信息。另外，主题控制服务（Topic Control）旨在确保聊天内容保持在预先设定的主题范围内。这意味着，聊天机器人能够

Nvidia推出NIM微服务，加强企业AI代理安全控制

Nvidia近日发布三项新的NIM（Nvidia Infrastructure Microservices）微服务，作为NeMo Guardrails开源工具包的扩展，旨在为企业AI代理应用提供更精细的安全管控能力。这三项新服务各具特色:一是针对内容安全，防止AI生成有害或带有偏见的内容;二是确保对话限定在获批主题范围内;三是防止AI代理突破系统限制或越狱。通过部署这些轻量级专门模型作为安全护栏，开发者可以弥补全局政策可能存在的保护漏洞。此举反映了AI落地过程中的实际挑战。尽管Salesforce CEO马克·贝尼奥夫曾预测其平台未来一年内

Nvidia 斥资 5 亿美元在以色列开发超级计算机

英伟达公司正在以色列北部建设一台功率达到30兆瓦的研究与开发超级计算机，预计投资额将达到5亿美元。这台超级计算机位于约克尼安伊利特附近的梅沃卡梅尔科技与工业园区，建筑面积达到10，000平方米，内部将搭载数百台最新一代的 Blackwell 液冷系统。虽然具体部署的加速器数量尚不明确，但以色列媒体报道称，这一配置预计将包含 “数千个” 图形处理单元（GPU），其性能将与以色列现有的 Israel-1超级计算机相媲美。Israel-1超级计算机由2，048个 H100加速器组成，采用英伟达的以太网

苹果、阿里巴巴与赛诺赛斯加入 AI 基础设施标准委员会

近日，超加速链接（UALink）联盟宣布，科技巨头苹果(Apple)、阿里巴巴(Alibaba)以及半导体知识产权供应商赛诺赛斯(Synopsys)正式加入其董事会。这一发展标志着行业对开放标准的支持力度不断增强，也可能对目前以 Nvidia 为首的封闭生态系统形成挑战。UALink 是一项高效的互连标准，旨在优化 AI 集群性能，能够将数百到上千个加速器连接在一起。自2024年10月成立以来，UALink 联盟的成员已经增长至65家，包括 AMD、英特尔、谷歌、AWS 和微软等众多行业巨头。值得注意的是，目前 Nvidia 并未加入该联