GitHub標星6000+!Python帶你實踐機器學習聖經PRML

點擊我愛電腦視覺標星,更快獲取CVML新技術


本文轉載自新智元。


新智元報道

來源:Github、知乎

編輯:白峰

【導讀】PRML是模式識別和機器學習領域的經典著作,出版於2007年。該書作者 Christpher M. Bishop 是模式識別和機器學習領域的專家,其1995年所著的「Nerual Networks for Pattern Recognition」也是模式識別、人工神經網路領域的經典著作。

將 Bishop 大神的 PRML 稱為機器學習聖經一點也不為過,該書系統地介紹了模式識別和機器學習領域內詳細的概念與基礎。書中有對概率論基礎知識的介紹,也有高階的線性代數和多元微積分的內容,適合高校的研究生以及人工智慧相關的從業人員學習。

知乎上關於這個關於「PRML為何是機器學習的經典書籍中的經典?」的高贊回答或許會給大家一些啟發:

Luau Lawrence的回答:

https://www.zhihu.com/question/35992297/answer/67009652

PRML 對初學者確實有一定難度,如果覺得吃力可以先讀一下知乎上推薦的科普性讀物,掌握了機器學習的基礎概念之後再進行後續的學習。

知乎討論地址:

https://www.zhihu.com/question/35992297

首先我們來看一下 PRML 的主要內容:

第一章是引子,用曲線擬合讓讀者對機器學習有個大概理解

第二章主要是介紹了一下基礎的統計方面的知識,包括期望方差的計算、高斯分布的參數估計與理解、高斯分布的性質等。

第三章和第四章主要在講最基礎的線性模型,並且展示了如何將其應用在分類和回歸的場景下,貝葉斯方法是整本書的核心。

第五章介紹了神經網路,在線性模型的基礎上引入了多層感知機模型,即常說的 BP 網路。

第六章講的是核方法,核是兩個樣本的內積,也可以理解為某個希爾伯特空間中由內積定義的「距離」。主要講了線性模型轉成核表達的方式、核的構建以及高斯過程。

第七章是向量機,向量機講的是貝葉斯模型如何通過先驗找到一個稀疏的模型。

第八章是講的圖模型,對變數的獨立性、隱變數和參數的區別(這個會在變分貝葉斯中體現)做了很好的闡釋。

第九章講了混合模型和 EM 演算法,涉及了隱變數的概念和 EM 演算法等。

第十章講的是變分推斷,解決了基於現在的模型的分布假設,推斷參數難的問題。

第十一章講取樣方法,介紹了不同取樣方法的優缺點,並重點講了MCMC取樣。

第十二章講主成分分析,是考察多個變數間相關性一種多元統計方法,研究如何通過少數幾個主成分來揭示多個變數間的內部結構。

第十三章講的是序列數據,序列數據的特點及馬爾可夫假設等。

第十四章講的是 Ensemble,包括適應性的 boosting 最著名的 AdaBoost,以及一些其他的融合方法。

看這些理論知識是非常枯燥的,很多初學者感覺學起來非常吃力,甚至半途放棄,如果你也有這些困擾,那麼下面提到的這個 GitHub 項目也許可以幫你走出困境。

在 notebooks 文件夾下實現了聚類方法、特徵抽取、線性模型、核方法、馬爾科夫模型、概率分布模型、取樣方法和神經網路方法等內容,你可以將目錄切換到

notebooks 下直接打開對應的 ipynb 文件進行練習。

該 GitHub 項目所需要的程式語言為 Python 3,其它科學計算庫還需要 NumPy 、SciPy、 Matplotlib、Scikit-learn 等,如果你是 Python 初學者,那麼我們強力推薦你安裝 Annaconda,它集成了所有需要的計算庫,並且可以在 jupyter notebook 互動式的查看執行的結果。

這麼好的資源趕緊學起來吧!

GitHub鏈接:

https://github.com/ctgk/PRML

CV細分方向交流群

52CV已經建立多個CV專業交流群,包括:目標跟蹤、目標檢測、語義分割、姿態估計、人臉識別檢測、醫學影像處理、超解析度、神經架構搜索、GAN、強化學習等,掃碼添加CV君拉你入群,如已經為CV君其他帳號好友請直接私信,

(請務必註明相關方向,比如:目標檢測)