GitHub標星6000+!Python帶你實踐機器學習聖經PRML
- 2020 年 3 月 5 日
- 筆記
點擊我愛電腦視覺標星,更快獲取CVML新技術
本文轉載自新智元。

新智元報道
來源:Github、知乎
編輯:白峰
【導讀】PRML是模式識別和機器學習領域的經典著作,出版於2007年。該書作者 Christpher M. Bishop 是模式識別和機器學習領域的專家,其1995年所著的「Nerual Networks for Pattern Recognition」也是模式識別、人工神經網路領域的經典著作。
將 Bishop 大神的 PRML 稱為機器學習聖經一點也不為過,該書系統地介紹了模式識別和機器學習領域內詳細的概念與基礎。書中有對概率論基礎知識的介紹,也有高階的線性代數和多元微積分的內容,適合高校的研究生以及人工智慧相關的從業人員學習。
知乎上關於這個關於「PRML為何是機器學習的經典書籍中的經典?」的高贊回答或許會給大家一些啟發:

Luau Lawrence的回答:
https://www.zhihu.com/question/35992297/answer/67009652
PRML 對初學者確實有一定難度,如果覺得吃力可以先讀一下知乎上推薦的科普性讀物,掌握了機器學習的基礎概念之後再進行後續的學習。
知乎討論地址:
https://www.zhihu.com/question/35992297
首先我們來看一下 PRML 的主要內容:
第一章是引子,用曲線擬合讓讀者對機器學習有個大概理解。
第二章主要是介紹了一下基礎的統計方面的知識,包括期望方差的計算、高斯分布的參數估計與理解、高斯分布的性質等。
第三章和第四章主要在講最基礎的線性模型,並且展示了如何將其應用在分類和回歸的場景下,貝葉斯方法是整本書的核心。
第五章介紹了神經網路,在線性模型的基礎上引入了多層感知機模型,即常說的 BP 網路。
第六章講的是核方法,核是兩個樣本的內積,也可以理解為某個希爾伯特空間中由內積定義的「距離」。主要講了線性模型轉成核表達的方式、核的構建以及高斯過程。
第七章是向量機,向量機講的是貝葉斯模型如何通過先驗找到一個稀疏的模型。
第八章是講的圖模型,對變數的獨立性、隱變數和參數的區別(這個會在變分貝葉斯中體現)做了很好的闡釋。
第九章講了混合模型和 EM 演算法,涉及了隱變數的概念和 EM 演算法等。
第十章講的是變分推斷,解決了基於現在的模型的分布假設,推斷參數難的問題。
第十一章講取樣方法,介紹了不同取樣方法的優缺點,並重點講了MCMC取樣。
第十二章講主成分分析,是考察多個變數間相關性一種多元統計方法,研究如何通過少數幾個主成分來揭示多個變數間的內部結構。
第十三章講的是序列數據,序列數據的特點及馬爾可夫假設等。
第十四章講的是 Ensemble,包括適應性的 boosting 最著名的 AdaBoost,以及一些其他的融合方法。
看這些理論知識是非常枯燥的,很多初學者感覺學起來非常吃力,甚至半途放棄,如果你也有這些困擾,那麼下面提到的這個 GitHub 項目也許可以幫你走出困境。

在 notebooks 文件夾下實現了聚類方法、特徵抽取、線性模型、核方法、馬爾科夫模型、概率分布模型、取樣方法和神經網路方法等內容,你可以將目錄切換到
notebooks 下直接打開對應的 ipynb 文件進行練習。

該 GitHub 項目所需要的程式語言為 Python 3,其它科學計算庫還需要 NumPy 、SciPy、 Matplotlib、Scikit-learn 等,如果你是 Python 初學者,那麼我們強力推薦你安裝 Annaconda,它集成了所有需要的計算庫,並且可以在 jupyter notebook 互動式的查看執行的結果。

這麼好的資源趕緊學起來吧!
GitHub鏈接:
https://github.com/ctgk/PRML
CV細分方向交流群
52CV已經建立多個CV專業交流群,包括:目標跟蹤、目標檢測、語義分割、姿態估計、人臉識別檢測、醫學影像處理、超解析度、神經架構搜索、GAN、強化學習等,掃碼添加CV君拉你入群,如已經為CV君其他帳號好友請直接私信,
(請務必註明相關方向,比如:目標檢測)