【讀書筆記】貝葉斯原理

Frequentist vs bayesian source - probabilisticworld. Com

頻率學派和貝葉斯學派

頻率學派 貝葉斯學派
概率的定義 事件重複若干次後頻率的極限 事件發生的不確定程度
判別方法 沒有先驗概率;要求事件是可重複的 有先驗概率
描述不確定程度 置信區間或p值 後驗概率
求解方法(測量全世界大學生的平均身高) 認為這是一個確定值,用極大似然估計求解 認為不同值都有一個概率,用貝葉斯定理求解後驗概率

條件概率的來源

  • 除了邏輯學中正誤確定的論斷,還應考慮有不確定可信度的論斷。類似於\(B\rightarrow A\)的邏輯推斷,當我們得到新資訊時,相關論斷的可信度也應發生變化。比如,對於\(B\rightarrow A\),當\(B\)的可信度提高時,\(A\)也應該提高(條件概率);當\(A\)的可信度提高時,有時\(B\)也會提高(貝葉斯方法)

  • 推導出唯一概率系統的考克斯公理

  • 概率論是常識推斷的定量表述

    ​ 類比邏輯論斷\(B\rightarrow A\),先驗概率\(P(B)\)為假設\(B\)成立的概率,條件概率\(P(A|B)\)為推斷「\(\rightarrow\)」成立的概率,聯合概率\(P(\mathbf{A}, \mathbf{B})\)為兩個假設同時成立的概率

  • 條件概率的計算式來源

    • 根據第三條公理可知,聯合事件發生的概率是由單一事件概率與條件概率決定的
    • 直觀上來看,\(P(A|B)\)\(P(B)\)越大,聯合事件發生的概率越大
    • 乘法能保證概率值始終在\([0,1]\)區間
    • 因此有\(P(\mathbf{A}, \mathbf{B})=P(\mathbf{A} \mid \mathbf{B}) P(\mathbf{B})\)

貝葉斯公式

  • 核心:利用變數間的相關性,用新得到可觀測變數的資訊來更新不可觀測變數估計

    • 當某一觀測變數發生後,另一不可觀測量的發生概率如何發生改變
    • 更新前的估計就是先驗概率
  • 舉例

不可觀測量\(A\) 可觀測量\(B\) 正向概率 \(P(B\mid A)\) 逆向概率 \(P(A\mid B)\)
發動機 發動機是不是壞了 聲音不對 壞了過後的聲音是不是這個聲音? 聽到這個聲音,發動機是不是壞了?
抽球 盒子中不同顏色小球的比例 摸出小球的顏色 摸出小球可能是什麼顏色? 盒中小球的顏色比例?
女神 女神是否喜歡你 女神對你笑 女神喜歡你的話,對你笑的概率有大? 女神如果對你笑了,喜歡你嗎?
  • 公式:\(P(A \mid B)= \frac{P(B \mid A)P(A)}{P(B)}\)

    可以理解為\(P(A,B) = P(A \mid B)P(B)=P(A)P(B \mid A)\)同一相關關係的不同描述角度

    Frequentist vs bayesian source - probabilisticworld. Com

  • 求解:

    以女神為例,要計算\(P(A \mid B)\),帶入公式計算其餘各項即可

    • \(P(A)\):女神之前就喜歡你嗎?如果是路人,還是設置為50%的概率吧
    • \(P(B|A)\):喜歡一個人大概率會笑吧,可以設置為60%
    • \(P(B)\):女神平時傻笑嗎?高冷的話可以設置為40%

    計算後可得,喜歡你的先驗概率提升為75%了!感謝貝葉斯!

貝葉斯公式的應用

  • 垃圾郵件篩選(垃圾郵件、敏感字詞)
  • 疾病檢測(得病,報告)
  • 貝葉斯方法可能是解決小樣本學習的關鍵方法