吳恩達教你讀論文:持續而緩慢的學習,才是正道
在人工智慧和機器學習領域中,了解前沿學者的最新研究的能力是每位嚴肅認真的機器學習從業人員都應該掌握的一項技能。為了跟上行業前沿並增加知識,機器學習從業人員需要具有學術性的思維和習慣。AI、ML和DL的發展日新月異,我們必須掌握前沿研究的知識,而這些知識只能通過閱讀論文才能獲得。
CS230是斯坦福大學開設的深度學習課程,由吳恩達主講,他在第8課中就如何讀論文提出了一些建議。
電腦視覺工程師Richmond Alake將課程內容總結為7個建議,寫成文章發表在Medium上,短短數日已收穫四千贊。
AI科技評論將文章編譯,希望為在科研道路上掙扎、或即將進入這個坑的學生,帶來一絲啟發:
本文將教你如何有效閱讀論文,包括系統閱讀論文集的方法,以及閱讀單篇論文的方法。在閱讀論文集時,需要搜集資源、做閱讀進度跟蹤表格、自己總結。在閱讀單篇論文時,需要分層次,按照需求逐漸深入理解論文。在讀完論文後,還要回答幾個問題,從而對論文的外延相關性有更好的理解。
我們以「姿勢估計」為例子,介紹如何閱讀與專業主題相關的研究論文。
1、集中精力閱讀領域主題相關的資源,包括研究論文、中篇文章、部落格文章、影片、GitHub repo等。
在搜索引擎上輸入「姿勢估計」就能快速找到熱門資源。首要的目標是整理所有相關資源,例如YouTube影片、實現文檔以及論文等等。理想情況下,不要限制重要資源的數量,但是一定要創建有用的論文、影片和文章的list。
2、深入研究與主題有關的任何資源。吳恩達建議繪製跟蹤對資源的理解水平的增長的表格,類似於下表。如果你對某個資源的理解程度是10%-20%,在第一列打勾,如果理解程度是20%-40%,在第二列打勾,以此類推。
確保瀏覽每篇論文至少10%-20%的內容,這樣可以對已有資源得到足夠的大概認識,並能夠準確地評估其相關性。
對於相關度更高的論文/資源,要更深入地理解它們。然後,你就可以確定一些適當的資源,這些資源包含你完全可以理解的內容。
吳恩達說,理解5到20篇論文後,就能對領域有一個基本認識,也許足夠讓你做出技術實現。吃透50-100篇論文後,就能對領域有很好的理解。
如果你的理解進度表格看起來是下圖的樣子,那基本表示你get到了重點。
3、進行結構化注釋,用自己的話總結論文中的關鍵發現和技術。
想讀一遍就理解論文是不可能的,吳恩達說,至少要準備閱讀論文三遍,以充分理解。
5、閱讀第二遍時,需要閱讀引言、結論,第三遍閱讀圖形和其餘部分。
論文的引言和結論部分包含論文的關鍵資訊以及所有研究發現。這兩個部分提供的資訊通常會忽略附錄部分,並且僅包含關鍵資訊。讀完這兩個部分,就可以為繼續閱讀其他部分打下基礎。
6、第三遍需要閱讀論文的全部內容,但可以跳過任何不熟悉的複雜數學公式,而且還可以跳過所有不了解或不熟悉的術語。
7、對於深入研究領域的人而言,可能還需要讀多幾遍。這幾遍將主要集中於對論文中的數學、技術和未知術語的理解。
對於那些出於資訊和工程目的閱讀論文的人,深入研究可能會非常耗時。
在閱讀論文時應該問自己以下幾個問題,這些問題可以幫助你了解論文中的關鍵資訊。
2、如果在論文中介紹了新方法,那麼新方法的關鍵要素是什麼?
「持續而緩慢的學習,而不是臨時抱佛腳,才能帶來長久的成長。」
吳恩達說過,他經常隨身攜帶幾篇論文,抽空閱讀。如果一個人在獲取知識時始終如一,無論是哪個領域,都會獲得超越普通人的理解和專業知識。
via //towardsdatascience.com/how-you-should-read-research-papers-according-to-andrew-ng-stanford-deep-learning-lectures-98ecbd3ccfb3