monodepth2學習1-原理介紹

monodepth2介紹

monodepth2是在2019年CVPR會議上提出的一種三維重建算法,monodepth2是基於monodepth進行了改進,採用的是基於自監督的神經網絡,提出了一下三點優化:

  1. 一個最小重投影誤差,用來提升算法處理遮擋場景的魯棒性
  2. 一種全分辨率多尺度採樣方法,可以減少視覺偽影
  3. 一種auto-masking loss,用來忽略訓練像素中違反相機運動假設的像素點

monodepth2的論文和代碼地址

論文地址://arxiv.org/abs/1806.01260
代碼地址://github.com/nianticlabs/monodepth2

自監督原理

神經網絡進行訓練生成深度圖,先獲取圖像特徵,通過特徵信息生成視差圖,再將視差圖轉化為深度圖。之後通過深度信息生成點雲,再將點雲還原為二維圖像,之後生成的二維圖像和原始二維圖像進行對比計算損失函數,通過反向傳播優化網絡減少損失函數,通俗的講,monodepth2的基本訓練原理就是這個。

monodepth2網絡結構