monodepth2學習1-原理介紹
- 2022 年 8 月 19 日
- 筆記
- monodepth2, monodepth2學習, 三維重建, 深度學習
monodepth2介紹
monodepth2是在2019年CVPR會議上提出的一種三維重建算法,monodepth2是基於monodepth進行了改進,採用的是基於自監督的神經網絡,提出了一下三點優化:
- 一個最小重投影誤差,用來提升算法處理遮擋場景的魯棒性
- 一種全分辨率多尺度採樣方法,可以減少視覺偽影
- 一種auto-masking loss,用來忽略訓練像素中違反相機運動假設的像素點
monodepth2的論文和代碼地址
論文地址://arxiv.org/abs/1806.01260
代碼地址://github.com/nianticlabs/monodepth2
自監督原理
神經網絡進行訓練生成深度圖,先獲取圖像特徵,通過特徵信息生成視差圖,再將視差圖轉化為深度圖。之後通過深度信息生成點雲,再將點雲還原為二維圖像,之後生成的二維圖像和原始二維圖像進行對比計算損失函數,通過反向傳播優化網絡減少損失函數,通俗的講,monodepth2的基本訓練原理就是這個。
monodepth2網絡結構


