20年的目標檢測大綜述(章節1)
- 2020 年 3 月 4 日
- 筆記
不知不覺2020年「電腦視覺戰隊」陪伴大家快兩個月了,由於疫情大家最近估計都沒有吃好喝好,但是大家肯定玩的很High,我們也一直在陪伴,分享最好最有品質的知識,陪伴大家度過疫情。今天開始,我們準備分享一次綜述性知識,有興趣的同學加入我們一起來學習,共同進步!
目 錄
1 INTRODUCTION
2 OBJECT DETECTION IN 20 YEARS
2.1 A Road Map of Object Detection
2.1.1 Milestones: Traditional Detectors
2.1.2 Milestones: CNN based Two-stage Detectors
2.1.3 Milestones: CNN based One-stage Detectors
2.2 Object Detection Datasets and Metrics
2.2.1 Metrics
2.3 Technical Evolution in Object Detection
2.3.1 Early Time』s Dark Knowledge
2.3.2 Technical Evolution of Multi-Scale Detection
2.3.3 Technical Evolution of Bounding Box Regression
2.3.4 Technical Evolution of Context Priming
2.3.5 Technical Evolution of Non-Maximum Suppression
2.3.6 Technical Evolution of Hard Negative Mining
3 SPEED-UP OF DETECTION
3.1 Feature Map Shared Computation
3.1.1 Spatial Computational Redundancy and Speed Up
3.1.2 Scale Computational Redundancy and Speed Up
3.2 Speed up of Classifiers
3.3 Cascaded Detection
3.4 Network Pruning and Quantification
3.4.1 Network Pruning
3.4.2 Network Quantification
3.4.3 Network Distillation
3.5 Lightweight Network Design
3.5.1 Factorizing Convolutions
3.5.2 Group Convolution
3.5.3 Depth-wise Separable Convolution
3.5.4 Bottle-neck Design
3.5.5 Neural Architecture Search
3.6 Numerical Acceleration
3.6.1 Speed Up with Integral Image
3.6.2 Speed Up in Frequency Domain
3.6.3 Vector Quantization
3.6.4 Reduced Rank Approximation
4 RECENT ADVANCES IN OBJECT DETECTION
4.1 Detection with Better Engines&Object detectors with new engines
4.2 Detection with Better Features
4.2.1 Why Feature Fusion is Important?
4.2.2 Feature Fusion in Different Ways
4.2.3 Learning High Resolution Features with Large Receptive Fields
4.3 Beyond Sliding Window
4.4 Improvements of Localization
4.4.1 Bounding Box Refinement
4.4.2 Improving Loss Functions for Accurate Localization
4.5 Learning with Segmentation
4.5.1 Why Segmentation Improves Detection?
4.5.2 How Segmentation Improves Detection?
4.6 Robust Detection of Rotation and Scale Changes
4.6.1 Rotation Robust Detection
4.6.2 Scale Robust Detection
4.7 Training from Scratch
4.8 Adversarial Training
4.9 Weakly Supervised Object Detection
5 APPLICATIONS
5.1 Pedestrian Detection
5.1.1 Difficulties and Challenges
5.1.2 Literature Review
5.2 Face Detection
5.2.1 Difficulties and Challenges
5.2.2 Literature review
5.3 Text Detection
5.3.1 Difficulties and Challenges
5.3.2 Literature Review
5.4 Traffic Sign and Traffic Light Detection
5.4.1 Difficulties and Challenges
5.4.2 Literature Review
5.5 Remote Sensing Target Detection
5.5.1 Difficulties and Challenges
5.5.2 Literature Review
6 CONCLUSION AND FUTURE DIRECTIONS

今天我們就先說說第一章:INTRODUCTION
目標檢測是數字影像中某一類 ( 如人、動物或汽車 ) 的重要電腦視覺任務。目標檢測的目標是開發計算模型和技術,提供電腦視覺應用程式所需的最基本的資訊之一:什麼目標在哪裡?
目標檢測作為電腦視覺的基本問題之一,是許多其他電腦視覺任務的基礎,如實例分割、影像字幕、目標跟蹤等。從應用程式的角度來看,目標檢測可以被分為兩個研究主題:「 General Object Detection 」 和 「 Detection Applications 」 ,前者旨在探索在統一的框架下檢測不同類型物體的方法,以模擬人類的視覺和認知;後者是指特定應用場景下的檢測,如行人檢測、人臉檢測、文本檢測等。
近年來,隨著深度學習技術的快速發展,為目標檢測注入了新的血液,取得了顯著的突破,將其推向了一個前所未有的研究熱點。目前,目標檢測已廣泛應用於自主駕駛、機器人視覺、影片監控等領域。下圖就顯示了過去二十年中與 「 目標檢測 」 相關的出版物數量的增長。

區別
近年來發表了許多關於 General Object Detection 的綜述。本文與上述綜述的主要區別總結如下:
- 基於技術演進的全面回顧:本文廣泛回顧了對象檢測發展史上的400多篇論文,時間跨度超過25年 ( 上世紀90年代至2019年 )。以前的大多數綜述僅僅關注一個較短的歷史時期或一些特定的檢測任務,而沒有考慮它們整個生命周期中的技術演進。站在歷史的高速公路上,不僅有助於讀者建立一個完整的知識體系,而且有助於找到這個快速發展領域的未來方向。
- 深入探索關鍵技術和最新技術狀態:經過多年的發展,目前的先進的對象檢測系統已經與 「 多尺度檢測 」、「 困難負樣本挖掘 」 、「 邊界框回歸 」 等大量技術相結合,然而,以前的綜述缺乏基本的分析來幫助讀者理解這些複雜技術的本質,例如,「 它們從哪裡來,它們是如何進化的? 」、「 每種方法的優缺點是什麼? 」本文針對上述問題對讀者進行了深入的分析。
- 全面分析加速檢測技術:加速目標檢測一直是一項關鍵而又具有挑戰性的任務。本文從多個層面對近20年來目標檢測技術的發展進行了全面的回顧,包括 「 檢測管道 」 ( 如級聯檢測、特徵圖共享計算 )、「 檢測主幹 」( 如網路壓縮、輕量級網路設計 )、「 數值計算 」( 如積分影像、矢量量化 )。以前的綜述很少涉及這個主題。
難點和挑戰
儘管人們總是問 「 在目標檢測中有哪些困難和挑戰? 」 ,事實上,這個問題並不容易回答,甚至可能被過度概括。由於不同的檢測任務具有完全不同的目標和約束,它們的困難程度可能會有所不同。除了其他電腦視覺任務中的一些常見挑戰,如不同視點下的物體、光照和類內變化,目標檢測的挑戰包括但不限於以下幾個方面:目標旋轉和尺度變化 ( 如小目標 ) ,精確的目標定位,密集和遮擋的目標檢測,加速檢測等。
在之後的第四章和第五章中,我們將對這些主題進行更詳細的分析。