目前最強開源人臉檢測算法RetinaFace
- 2019 年 12 月 27 日
- 筆記
人臉檢測為目標檢測的特例,是商業化最早的目標檢測算法,也是目前幾乎各大CV方向AI公司的必爭之地。
WIDER FACE數據集是由香港中文大學發佈的大型人臉數據集,含32,203幅圖像和393,703個高精度人臉包圍框,該庫中人臉包含尺度、姿態、表情、遮擋和光照等變化。

WIDER FACE 幾乎是目前評估人臉檢測算法最權威的數據集。
RetinaFace 是今年5月份出現的人臉檢測算法,當時取得了state-of-the-art,作者也開源了代碼,過去了兩個月,目前僅以極其微弱的精度差屈居第二名,但因為第一名的AInnoFace算法(來自北京創新奇智公司)沒有開源,所以目前RetinaFace可稱得上是目前最強的開源人臉檢測算法。

RetinaFace來自論文RetinaFace: Single-stage Dense Face Localisation in the Wild,作者來自帝國理工學院、InsightFace、Middlesex University London、FaceSoft。

相信很多朋友對InsightFace並不陌生,它是目前針對2D與3D人臉分析(含檢測、識別、對齊、屬性識別等)最知名和開發者最活躍的開源庫。RetinaFace代碼已經併入該庫。
下圖為在WIDER FACE 數據集上驗證集三個子集的排名靠前的算法結果曲線和精度:

下圖為在WIDER FACE 數據集上測試集三個子集的排名靠前的算法結果曲線和精度:

在6個子集中,RetinaFace取得1個第一名,2個並列第1名,3個以極其微弱精度差屈居於第二名。
RetinaFace使用特徵金字塔網絡架構:

其主要創新點在損失函數的設計。
下圖說明了RetinaFace的核心思想:

在人臉檢測多任務學習中,除了傳統的人臉分類損失函數和包圍框回歸損失函數,作者額外標註了人臉 5 點信息,並以此引入人臉對齊的額外監督信息損失函數,還引入了self-supervised解碼分支預測3D人臉信息分支。
集合了更多監督信息和自監督信息,是 RetinaFace 取得成功的關鍵。
很多時候,人臉檢測是為了後續的識別,作者特意將檢測結果送入人臉驗證網絡,在IJB-C test set上測試結果表明可以提高ArcFace的人臉驗證精度(TAR=89.59% for FAR=1e-6)。

由上圖可知,相對於MTCNN,在助力人臉驗證上有一致性精度提高的表現。
更為難能可貴的是,使用輕量級骨幹網絡,RetinaFace算法在CPU上測試VGA圖片可以達到實時。如下圖:

論文地址:
https://arxiv.org/pdf/1905.00641.pdf
代碼地址:
https://github.com/deepinsight/insightface/tree/master/RetinaFace