自动驾驶也要玩“元宇宙”？极佳科技用AI脑补，让4D场景重建更丝滑！

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Oct 28, 2024

294

近日，极佳科技提出了一种名为 DriveDreamer4D 的全新框架，旨在利用世界模型的先验知识来提升4D 驾驶场景的重建效果。

传统的4D 场景重建方法，主要依赖于 NeRF 和3DGS 这两大流派。NeRF 就好比一个超级画家，它能用神经网络，把一堆照片渲染成一个3D 模型。而3DGS 则是用一堆三维高斯函数，来模拟场景中的各种物体。

但这两种方法都有个致命弱点:太依赖训练数据了!就好比，你只见过直线行驶的汽车，突然来个漂移过弯，你就懵逼了。所以，在面对复杂路况，比如变道、加速、减速的时候，它们就容易翻车。

为了解决这个问题，极佳科技这次祭出了一个大杀器——DriveDreamer4D。这玩意儿，简单来说，就是给4D 场景重建加了个 AI 外挂——世界模型。

世界模型，你可以理解成一个 AI 大脑，它能根据已有的数据，预测未来可能发生的情况。DriveDreamer4D 就是利用世界模型，来生成各种复杂路况下的新视角视频数据，相当于给4D 场景重建模型喂了“脑补”的训练数据，让它见多识广，不再翻车。

更牛逼的是，DriveDreamer4D 还专门设计了一个新轨迹生成模块（NTGM）。这玩意儿，能自动生成各种符合交通规则的新轨迹，比如变道、加速、减速等等，然后用世界模型生成对应视角的视频，相当于给4D 场景重建模型请了个“陪练”，让它在各种复杂路况下都能游刃有余。

实验结果也证明了 DriveDreamer4D 的实力。在处理复杂路况时，它的重建效果明显优于传统方法，生成图像的保真度更高，而且还能准确地还原车辆和车道线的位置。

总而言之，DriveDreamer4D 的出现，就像是在4D 场景重建领域扔了一颗核弹，直接炸开了技术的天花板。有了它，自动驾驶的研发和测试，将会更加高效、安全和可靠。

当然，DriveDreamer4D 目前还处于研究阶段，未来还有很多可以改进的地方。但我相信，随着技术的不断发展，它将会越来越强大，最终成为自动驾驶领域不可或缺的一部分。

论文地址：https://arxiv.org/pdf/2410.13571

项目主页:https://drivedreamer4d.github.io/

代码地址:https://github.com/GigaAI-research/DriveDreamer4D

DriveDreamer4D 世界模型 NeRF 3DGS

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

卓驭科技成功接入阿里通义大模型，推动智能驾驶技术发展

在最新的上海车展上，卓驭科技（简称 “卓驭”）宣布其已成功接入阿里通义大模型，这一举措标志着其在智能驾驶领域的又一重要进展。作为智驾驾驶供应商及服务商，卓驭借助阿里云的强大计算能力，致力于构建一个端到端的智能驾驶世界模型，以提升汽车的智能化水平。近年来，智能驾驶技术得到了快速发展，各大汽车制造商纷纷加大在这一领域的投入。卓驭科技在与阿里通义大模型的合作中，已经将其核心的大数据业务系统迁移至阿里云平台，这一转变将使其能够更高效地处理和

2025年4月24号 14:21

10.9k

小鹏汽车推新物理大模型，定位AI汽车公司

近日，小鹏汽车创始人何小鹏在社交媒体上透露，作为将 “智能化” 作为核心的车企之一，小鹏汽车的本质定位在于 “AI 汽车公司”。他强调，人工智能（AI）最大的价值不仅在于数字世界的应用，更在于能够改变我们的物理世界。这一观点引发了行业内外的关注与讨论。何小鹏表示，小鹏汽车坚持全栈自研的理念，去年首次在自动驾驶领域引入了强化学习与模型蒸馏的技术路线，这一创新举措使得小鹏在行业内具备了独特竞争力。他透露，小鹏正在训练一个超大规模的物理世界模型，

2025年4月14号 10:21

2.0k

Wayve推完整世界模型GAIA-2：支持同时生成5个视角的视频，可模拟高风险场景

Wayve公司近日隆重推出了其最新的视频生成世界模型——GAIA-2。这一突破性的技术是其上一代模型GAIA-1的重大升级，旨在通过生成高度多样化和可控的驾驶场景视频，极大地推动辅助和自动驾驶系统的安全性发展. GAIA-2的发布标志着Wayve在利用生成式人工智能技术赋能更安全、更智能的出行方面迈出了坚实的一步。GAIA-1的飞跃:场景多样性全面提升与GAIA-1相比，GAIA-2最显著的提升在于其生成视频场景的丰富性和真实感. 为了训练和验证自动驾驶系统在各种复杂环境下的性能，需要接触到尽可能

2025年3月31号 11:02

3.0k

阶跃星辰与智元机器人达成合作探索大模型+具身机器人应用

上海阶跃星辰智能科技有限公司与智元机器人正式签署深度战略合作协议，双方将在基座大模型和机器人研发领域展开深度合作，共同探索“大模型+具身机器人”的技术突破与应用创新。此次合作涉及世界模型技术研发、具身智能领域数据合作以及新零售等应用场景的落地，旨在推动具身智能技术在家庭服务、新零售、智能制造等领域的规模化应用。

2025年3月13号 17:31

2.0k

AI日报：百度文心大模型4.5系列将开源；昆仑万维发布世界模型Matrix-Zero；苹果预计2025年中将AI功能引入中国iPhone

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、百度：将在未来几个月推出文心大模型4.5系列并于6月30日起正式开源今日，百度公司宣布将在未来几个月推出文心大模型4.5系列，并计划于6月30日正式向公众开源。尽管删除了这些警告，ChatGPT仍然会对某些不当内容进行审查。

2025年2月14号 15:15

580

昆仑万维发布Matrix-Zero世界模型：国内首创3D场景与可交互视频生成

昆仑万维今日宣布正式推出其Matrix-Zero世界模型，成为国内首家同时具备3D场景生成和可交互视频生成能力的人工智能企业，标志着其在空间智能领域迈出了重要一步。Matrix-Zero的核心亮点在于其强大的3D场景生成功能。该功能可以将用户输入的图片转化为具有全局一致性、可自由探索的真实3D场景。这一突破性技术具备以下几个关键特性:全局一致性: Matrix-Zero生成的3D场景具有高度的全局一致性。例如，输入一张“城堡花园一角”的图片，模型可以生成一个360度环视后场景保持不变的3D环境，

2025年2月14号 14:45

6.9k

昆仑万维发布Matrix-Zero世界模型支持3D场景、可交互视频生成

2025年2月14日，昆仑万维集团正式推出Matrix-Zero世界模型，标志着中国在空间智能领域迈出了重要一步。Matrix-Zero包含两款子模型:3D场景生成大模型和可交互视频生成大模型，旨在通过AI技术重塑数字内容创作模式，推动影视制作、游戏开发、具身智能等行业的创新发展。

2025年2月14号 10:16

4.7k

Uber与英伟达达成合作，加速自动驾驶技术发展

在2025年消费电子展（CES）上，优步(Uber)宣布与英伟达(Nvidia)达成合作，借助其新推出的生成世界模型仿真工具 Cosmos 和基于云的人工智能超级计算平台 DGX Cloud，进一步推动自动驾驶技术的发展。这一举措旨在提升优步在自动驾驶领域的竞争力和技术水平。Cosmos 是一种专为机器人和自动驾驶公司设计的工具，它能够从多种输入生成基于物理的高清视频，模拟出真实的工业和驾驶环境。其背后是海量的数据支撑，包括从2000万小时的视频中生成的9000万亿个数据令牌。这一技术的运用可以帮助优

2025年1月8号 9:41

1.5k

Tim Brooks 跳槽 DeepMind，欲打造新一代世界模型团队

在 AI 领域，人才流动向来是激烈的竞争场所。最近，Tim Brooks 的跳槽事件引发了广泛关注。他在 Sora 工作仅三个月后，宣布转投竞争对手 Google DeepMind。此举被认为是由于 Sora 技术面临严重挑战，特别是在生成速度和性能上，与行业中的其他对手相比表现不佳。据报道，Sora 在技术上存在诸多问题，难以与 Luma、Stability、Runway 等公司抗衡。而与此同时，竞争者们在市场上的快速发展让 Sora 显得相形见绌。Tim Brooks 的出走引发了业界的猜测，有人认为他将加入 Google 后参与其视频生成项目 Veo，

2025年1月7号 16:04

1.9k

扩散模型也能玩游戏？DIAMOND实现Atari 100k基准测试新SOTA

强化学习在近年来取得了许多成功，但其样本效率低下，限制了其在现实世界中的应用。世界模型作为一种环境生成模型，为解决这一问题提供了希望。它可以作为模拟环境，以更高的样本效率训练强化学习智能体。目前，大多数世界模型通过离散潜变量序列来模拟环境动态。然而，这种压缩成紧凑离散表示的方法可能会忽略对强化学习至关重要的视觉细节。与此同时，扩散模型已经成为图像生成领域的主导方法，挑战了传统的离散潜变量建模方法。受此启发，研究人员提出了一种名为DI

2024年11月18号 14:29

1.6k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图