高斯分布|機器學習推導系列(二)
一、概述
假設有以下數據:
二、通過極大似然估計高斯分布的均值和方差
1. 極大似然
2. 高斯分布
3. 一維高斯分布下的估計
-
關於
的似然函數
-
通過極大似然估計法求解
-
證明
是無偏估計
-
通過極大似然估計法求解
-
證明
是有偏估計
要證明是有偏估計就需要判斷
,證明如下:
可以理解為當取
就已經確定了所有
的和等於
,也就是說當
個
確定以後,第
個
也就被確定了,所以少了一個「自由度」,因此
。
方差的無偏估計:
三、為什麼高斯分布的等高線是個「橢圓」
1. 高斯分布與馬氏距離
-
多維高斯分布
-
馬氏距離
2. 證明高斯分布等高線為橢圓
-
協方差矩陣的特徵值分解
任意的實對稱矩陣都有
個線性無關的特徵向量。並且這些特徵向量都可以正交單位化而得到一組正交且模為 1 的向量。故實對稱矩陣
可被分解成
。
-
將概率密度整理成橢圓方程的形式
上式中可以理解為將
減去均值進行中心化以後再投影到
方向上,相當於做了一次坐標軸變換。
當的維度為2即
時
,得到類似橢圓方程的等式,所以也就可以解釋為什麼其等高線是橢圓形狀。二維高斯分布的影像如下所示:
四、高斯分布的局限性
1. 參數過多
協方差矩陣中的參數共有
個(
是對稱矩陣),因此當
的維度
很大時,高斯分布的參數就會有很多,其計算複雜度為
。
可以通過假設高斯分布的協方差矩陣為對角矩陣來減少參數,當高斯分布的協方差矩陣為對角矩陣時,特徵向量的方向就會和原坐標軸的方向平行,因此高斯分布的等高線(同心橢圓)就不會傾斜。
另外如果在高斯分布的協方差矩陣為對角矩陣為對角矩陣的基礎上使得其特徵值全部相等(即),則高斯分布的等高線就會成為一個圓形,而且不會傾斜,稱為各向同性。
2. 單個高斯分布擬合能力有限
解決方案是使用多個高斯分布,比如高斯混合模型。
五、求高斯分布的邊緣概率與條件概率
1. 概述
首先將變數、均值和方差進行劃分:
本部分旨在根據上述已知來求。
2. 定理
以下定義為推導過程中主要用到的定理,這裡只展示定理的內容,不進行證明:
一個簡單但不嚴謹的證明:
3. 求邊緣概率
所以,同理
。
4. 求條件概率
現在可以得到。根據
與
的關係可以得到
的分布:
因此可以得到,同理可以得到
。
六、求高斯分布的聯合概率分布
1. 概述
本部分旨在根據上述已知來求。
2. 求解
由上述已知可以確定與
的關係為線性高斯模型,則
與
符合下述關係:
然後求解的均值和方差:
3. 求解
求解需要首先求解
與
的聯合分布,然後根據上一部分的公式直接得到
。