更快更准确！字节跳动发布新一代Depth Anything V2深度模型

AIbase

发布于AI新闻资讯 · 1 分钟阅读 · 2024年6月14号 14:11

929

站长之家（ChinaZ.com）6月14日消息:字节跳动发布了新一代的Depth Anything V2深度模型，该模型在单眼深度估计领域实现了显著的性能提升。与前一代Depth Anything V1相比，V2版本具有更精细的细节和更强的鲁棒性，同时在效率上也有了显著提高，比基于Stable Diffusion的模型快了10倍以上。

关键特点:

更精细的细节:V2模型在细节上进行了优化，提供了更精细的深度预测。

高效率与准确性:与基于SD构建的模型相比，V2在效率和准确性上都有显著提升。

多规模模型支持:提供了不同规模的模型，参数从25M到1.3B不等，以适应不同的应用场景。

关键实践:通过使用合成图像替换真实图像、扩大教师模型容量、利用大规模伪标注图像教授学生模型等方法，提高了模型的性能。

提升模型性能的三个关键实践:

合成图像的使用:用合成图像取代了所有标注的真实图像，提高了模型的训练效率。

教师模型容量扩大:通过扩大教师模型的容量，增强了模型的泛化能力。

伪标注图像的应用:使用大规模伪标注的真实图像作为桥梁，教授学生模型，提高了模型的鲁棒性。

广泛应用场景的支持:

为了满足广泛的应用需求，研究人员提供了不同规模的模型，并利用其泛化能力，通过度量深度标签进行微调。

构建了一个多样化的评估基准，包含稀疏深度注释，以促进未来研究。

基于合成与真实图像的训练方法:

研究人员首先在合成图像上训练了最大的教师模型，然后为大规模未标注的真实图像生成了高质量的伪标签，并在这些伪标记的真实图像上训练了学生模型。

训练过程使用了595K合成图像和62M+真实伪标记图像。

Depth Anything V2模型的推出，展示了字节跳动在深度学习技术领域的创新能力，其高效和准确的性能特点预示着该模型在计算机视觉领域具有广泛的应用潜力。

项目地址：https://depth-anything-v2.github.io/

豆包上线深度推理模式：AI逻辑链条可视化，问答搜索新突破

字节跳动近日为其AI助手豆包推出了“深度思考”推理模式，这一创新功能旨在彻底改变用户在问答、搜索、写作和阅读等场景下的交互体验。此模式通过展示AI解决问题的完整逻辑链条，包括自我质疑、假设验证和错误修正等步骤，让用户能够更深入地了解AI的思考过程。这种可视化的思考方式不仅提升了用户对AI的信任度，也使得AI的反馈更具透明性和可解释性。这项技术基于豆包1.5基座模型研发，并得益于深度推理模型Doubao-1.5-pro-AS1-Preview的技术突破，通过RL算法和工程优化，充分发挥

抖音打通豆包AI，字节跳动开启超级AI生态战略

据Tech星球消息，抖音App正在测试接入豆包AI能力，在应用内为豆包开放两个战略性入口，标志着字节跳动正加速推进其AI生态布局。这两个入口分别位于短视频界面和消息列表，旨在彻底打破AI产品与流量平台的传统壁垒。此前，用户需要跳出抖音才能使用豆包，导致使用频次和粘性不足。通过直接整合，抖音不仅可以提升自身产品的AI能力，还能为豆包引入更广阔的用户流量。字节内部正在同步推进多条AI产品业务线，包括魔方知道、记易、小荷AI医生等，覆盖资讯阅读、医疗、编程等多个

字节跳动AI编程产品Trae国内版发布配置豆包1.5pro、满血版DeepSeek模型

中国首款AI原生集成开发环境（AI IDE）Trae国内版正式上线。该产品由字节跳动技术团队推出，旨在为开发者提供更高效、智能化的编程体验。Trae国内版配置了Doubao-1.5-pro，并支持切换满血版DeepSeek R1、V3模型，能够显著提升编程速度，助力开发者应对复杂技术挑战。

字节跳动推出 AIBrix：全新开源推理系统专为大语言模型设计

字节跳动近日宣布开源其最新研发的 AIBrix 推理系统。这一系统特别为 vLLM 推理引擎打造，目标是提供一个可扩展且高性价比的推理控制面，满足企业日益增长的 AI 需求。AIBrix 的推出标志着一个新阶段的开始，项目团队希望通过这一开源项目为构建可扩展的推理基础设施奠定基础。该系统提供了一整套云原生解决方案，致力于优化大语言模型的部署、管理和扩展能力。特别是它对企业级需求进行了深度适配，确保用户在使用时能够享受到更高效的服务。在功能方面，首版 AIBrix 聚焦于几个

AI新闻资讯