清华大学和哈佛大学的研究人员开发了 LangSplat,这是一种基于 3D 高斯技术的人工智能方法,用于在 3D 环境中进行开放式语言查询。LangSplat 通过独特的 3D 语言领域构建和语言嵌入技术,减少内存使用并解决点模糊问题,展示出更快的处理速度和改进的精度,推动了 3D 语言领域的发展。
相关AI新闻推荐

清华哈佛发布LangSplat 通过文字搜索即可快速在3D场景找到目标定位
最近,清华大学和哈佛大学的学霸们,就捣鼓出了这样一项黑科技——LangSplat。它通过三维高斯泼溅技术,让文字在三维空间中"活"起来,实现对真实世界的开放文本查询。
LangSplat:3D语言高斯模型,比LERF快199倍
["LangSplat是创新的3D语言高斯模型,通过将CLIP特征映射到3D语言场,实现了比LERF快199倍的精准搜索。","3D语言场构建了支持在3D空间进行开放式语言查询的环境。","LangSplat通过可视化学习特征,捕捉物体边界,无需后处理,在1440×1080分辨率下比LERF快199倍。","研究人员测试发现LangSplat更加准确,能够标记物体的不同部分和成分,例如在一碗拉面汤中。","在LERF数据集和3D OVS数据集上,LangSplat在速度和准确性上均明显优于LERF。"]
SAGA:3D高斯交互分割,毫秒级加速1000倍
["上海交大和华为团队联合推出SAGA,实现3D场景中毫秒级精细分割。","通过融合2D分割和3D高斯技术,加速近1000倍,展现卓越性能。","SAGA克服细粒度、多粒度分割的挑战,支持点、涂鸦和2D掩模。","论文已发布在arXiv,在基准测试中与最先进方法媲美,引发科研关注。"]