智源研究院开源 10 亿参数三维视觉通用模型 Uni3D
站长之家
26
智源研究院最近开源了 10 亿参数的三维视觉通用模型 Uni3D。该模型能够处理点云数据,取得了主流三维视觉任务的全方位技术突破,展现出超强的通用视觉能力。Uni3D 的研发团队借鉴了二维视觉模型的设计经验,并引入多模态对齐的训练方法,使其可以直接继承二维视觉模型学习到的知识,取得强大的三维视觉能力。该模型在各类三维视觉任务上都取得了 state-of-the-art 的结果,展示了其强大的通用性和迁移学习能力。智源研究院表示,Uni3D 的开源发布为未来三维计算机视觉的研究和应用奠定了坚实的基础。
© 版权所有 AIbase基地 2024, 点击查看来源出处 - https://www.aibase.com/zh/news/2349