CDA 試聽課|什麼是卷積神經網絡運算?

  • 2019 年 10 月 7 日
  • 筆記

CDA 金牌講師覃老師,帶你5分鐘了解什麼是卷積神經網絡運算?

請點擊下方視頻觀看~

卷積神經網絡(Convolutional Neural Network,CNN或ConvNet)是一種具有局部連接、權重共享等特性的深層前饋神經網絡。

卷積神經網絡最早是主要用來處理圖像信息。如果用全連接前饋網絡來處理圖像時,會存在以下兩個問題:

(1)參數太多

如果輸入圖像大小為100 × 100 × 3(即圖像高度為100,寬 度為100,3個顏色通道:RGB)。在全連接前饋網絡中,第一個隱藏層的每個神經元到輸入層都有100 × 100 × 3 = 30, 000個相互獨立的連接,每個連接都對應一個權重參數。隨着隱藏層神經元數量的增多,參數的規模也會急劇增加。這 會導致整個神經網絡的訓練效率會非常低,也很容易出現過擬合。

(2)局部不變性特徵

自然圖像中的物體都具有局部不變性特徵,比如在尺度縮放、平移、旋轉等操作不影響其語義信息。而全連接前饋網絡很難提取這些局部不變特徵,一般需要進行數據增強來提高性能。

卷積神經網絡是受生物學上感受野的機制而提出。感受野(Receptive Field) 主要是指聽覺、視覺等神經系統中一些神經元的特性,即神經元只接受其所支 配的刺激區域內的信號。在視覺神經系統中,視覺皮層中的神經細胞的輸出依 賴於視網膜上的光感受器。視網膜上的光感受器受刺激興奮時,將神經衝動信 號傳到視覺皮層,但不是所有視覺皮層中的神經元都會接受這些信號。一個神經元的感受野是指視網膜上的特定區域,只有這個區域內的刺激才能夠激活該神經元。

目前的卷積神經網絡一般是由卷積層、匯聚層和全連接層交叉堆疊而成的 前饋神經網絡,使用反向傳播算法進行訓練。卷積神經網絡有三個結構上的特性:局部連接,權重共享以及匯聚。這些特性使得卷積神經網絡具有一定程度上的平移、縮放和旋轉不變性。和前饋神經網絡相比,卷積神經網絡的參數更少。

卷積神經網絡主要使用在圖像和視頻分析的各種任務上,比如圖像分類、人臉識別、物體識別、圖像分割等,其準確率一般也遠遠超出了其它的神經網絡模型。近年來卷積神經網絡也廣泛地應用到自然語言處理、推薦系統等領域。