智源研究院最近开源了 10 亿参数的三维视觉通用模型 Uni3D。该模型能够处理点云数据,取得了主流三维视觉任务的全方位技术突破,展现出超强的通用视觉能力。Uni3D 的研发团队借鉴了二维视觉模型的设计经验,并引入多模态对齐的训练方法,使其可以直接继承二维视觉模型学习到的知识,取得强大的三维视觉能力。该模型在各类三维视觉任务上都取得了 state-of-the-art 的结果,展示了其强大的通用性和迁移学习能力。智源研究院表示,Uni3D 的开源发布为未来三维计算机视觉的研究和应用奠定了坚实的基础。