電腦視覺入門路線
- 2022 年 4 月 20 日
- 筆記
給大家寫了一個電腦視覺入門路線,這個路線一共分為十一步,每一步指明了學習內容,學習程度,學習方式和學習目的,並指明了各個內容的重難點。
歡迎關注公眾號CV技術指南,專註於電腦視覺的技術總結、最新技術跟蹤、經典論文解讀、CV招聘資訊。
本文主要介紹電腦視覺從入門到具備自主學習能力的一個學習路線。
在介紹具體內容前,有必要先說明現在電腦視覺的情況。
電腦視覺是一個需要會的內容特別多,基礎要求牢固,知識面要求足夠廣的領域。
電腦視覺領域有一個最大的問題在於它使用的方法具有黑盒的特點,一個完整的模型由很多部分組成,其中每個部分都有許許多多的參數,而任何一個地方的改變都有可能影響模型最終的效果,大的會影響收斂與不收斂,小的會使指標浮動好幾個點。但你並不知道每個部分對模型的作用,也不知道模型是如何學習的。
因此,如果你是僅僅學了一下神經網路,學了一下pytorch或tensorflow,然後就開始看別人的部落格學YOLO,學語義分割,github上跑了幾個現有的模型。那你註定對電腦視覺很難有什麼深刻的理解,不管是調參,還是設計模型,都純屬瞎碰運氣。效果不好你不知道為什麼,效果好你也不知道為什麼。
當然了,即便你學得非常好,最終也還是不知道為什麼好,為什麼不好,不然就不叫黑盒了。但有所不同的是,你可以根據你的積累,從你自己對電腦視覺的理解上嘗試去解釋它為什麼好,為什麼不好。這就是電腦視覺領域所有論文的本質了,大家都是在根據自己的理解去設計模型去調試參數。這與前面說的並不矛盾。
因此,如果你想學習電腦視覺,非常牢固的基礎和廣泛的知識面是缺一不可的。
網上已經有很多的入門電腦視覺的經驗,有些說機器學習十大演算法要去手推一遍,否則基礎不牢,有些上來就給一堆專業書籍如西瓜書、模式識別、統計學習方法。
對我自己來說,這些書我都看了,但我寫的路線里不會這麼干,因為這不符合循序漸進的原則。此外,學電腦視覺的不外乎兩類人,一類是本科就在利用空餘時間學習的,一類是讀研了選擇了這個方向,但不管是哪一類,都意味著學這個是沒有像考試及格那樣的硬性要求來強迫你學的。如果一開始就學不明白,一開始就看西瓜書、模式識別這類晦澀難懂的書,會激發人性的弱點,很容易就放棄了。
什麼是一個好的學習路線?它應該是降低執行難度的,大部分人都只會懷疑是自己行動力太差的問題,而不去懷疑是不是學習路線執行難度太大。它需要保證學習者在學習過程中時時獲得成就感,需要保證學得懂,在學習過程中產生繼續學的動力,而不是靠著考試的硬性要求或自身強大的意志力在學。
上面廢話就講到這,本文嘗試寫一個執行難度低的,符合人性弱點的學習路線。
以前寫過一個免費版的,裡面介紹了對於電腦視覺要學的一些內容,也提供了一些資料。本文收費版與之不同的地方在於本文介紹得更加詳細,介紹了學習的先後順序,每個內容的重要程度,哪些可以不用深入,哪些必須要非常熟悉,後續如何進階等。
第一步:統計學習方法
學習內容:關於模型的一些基本概念,簡單的幾個模型:感知機、回歸模型、判別模型等。
學習程度:
1. 了解統計學習方法的三要素、模型評估、模型選擇;
2. 了解判別模型與生成模型;
3. 熟悉感知機、回歸模型、分類模型,了解它們的區別,原理即可;
4. 了解泛化能力、分類問題、標註問題等;
學習方式:閱讀《統計學習方法》李航版第一章、第二章即可,後面的先不急著去看。
學習目的:主要是了解什麼是模型、有哪些模型、模型的性能影響等基本知識面。
有很多人學到後面連如何判斷一個模型的泛化能力、什麼時候過擬合、什麼時候欠擬合都不知道,這一部分主要把握如何分析一個模型的泛化能力,學會區分過擬合欠擬合,如何評估一個模型等。
第一步學的是什麼是模型、模型的基本概念,而《統計學習方法》李航版這本書的後面都是一些具體的模型,對電腦視覺來說基本都用不上,至少不需要深入了解,因此在初學階段完全不建議大家去學這些模型。
相反,應該儘快學一些能用得上的模型,以便儘快了解電腦視覺大概是怎麼一回事。在已經有一定的基礎後再回來學後面的其它模型,用於擴展知識面、提高自己的思維能力,這樣在學後面這些模型時才能理解,否則學了也會忘了。
因此第二步主要學習神經網路,神經網路也是一個具體的模型。
完整版請閱讀:《電腦視覺入門路線》
歡迎關注公眾號CV技術指南,專註於電腦視覺的技術總結、最新技術跟蹤、經典論文解讀、CV招聘資訊。
CV技術指南創建了一個免費的知識星球。關注公眾號添加編輯的微訊號可邀請加入。
其它文章
Attention Mechanism in Computer Vision
從零搭建Pytorch模型教程(三)搭建Transformer網路
StyleGAN大匯總 | 全面了解SOTA方法、架構新進展
目標檢測、實例分割、多目標跟蹤的Anchor-free應用方法總結