Depth Anything

大規模未ラベルデータの力を解き放つ

中国セレクション画像深度推定画像処理
Depth Anythingは、堅牢な単眼深度推定のための非常に実用的なソリューションです。私たちは、新規の技術モジュールを追求するのではなく、あらゆる状況におけるあらゆる画像を処理できる、シンプルで強力な基礎モデルの構築を目指しました。そのため、データエンジンを設計してデータセットを拡張し、大規模な未ラベルデータ(約6200万枚)を収集および自動アノテーションすることで、データカバレッジを大幅に拡大し、汎化誤差の低減を実現しました。データ拡張を有望なものにするために、2つのシンプルかつ効果的な戦略を研究しました。まず、データ拡張ツールを活用して、より挑戦的な最適化目標を作成します。これにより、モデルは積極的に追加の視覚情報を求め、強力な表現を獲得することを余儀なくされます。次に、事前学習済みエンコーダーから豊富な意味的事前情報を継承させるための補助的な監督を開発しました。6つの公開データセットとランダムに撮影された写真を含む、そのゼロショット能力について広範な評価を行いました。その汎化能力は非常に印象的です。さらに、NYUv2とKITTIからのメトリック深度情報を使用して微調整することにより、新たな最先端技術(SOTA)を確立しました。私たちの改良された深度モデルは、より優れた深度条件付きControlNetをもたらしました。私たちのモデルはhttps://github.com/LiheYoung/Depth-Anythingで公開されています。
ウェブサイトを開く

Depth Anything 最新のトラフィック状況

月間総訪問数

4912

直帰率

55.70%

平均ページ/訪問

1.2

平均訪問時間

00:00:00

Depth Anything 訪問数の傾向

Depth Anything 訪問地理的分布

Depth Anything トラフィックソース

Depth Anything 代替品