odd ratio值在關聯分析中的含義

  • 2019 年 12 月 17 日
  • 筆記

在GWAS分析中,利用卡方檢驗,費舍爾精確檢等方法,通過判斷p值是否顯著,我們可以分析snp位點與疾病之間是否存在關聯,然而這得到的僅僅是一個定性的結論,如果存在關聯,其關聯性究竟有多強呢?

很顯然,我們需要一個量化指標來描述關聯的強弱程度。類似於相關性檢驗,通過p值只能夠說明兩個變量是否相關。至於其相關性的大小,是正相關還是負相關,還需要結合相關係數來作出判斷。在關聯分析中的」相關係數」則對應兩個常用的統計量, risk ratio和odd ratio。

以探究吸煙和肺癌之間的關聯為例,基於的數據格式如下

肺癌

正常個體

吸煙

a

b

不吸煙

c

d

risk ratio, 也叫做relative risk, 簡寫為RR, 通常稱之為相對風險度,是暴露組的發病率與非暴露組的發病組的比值。對於上述數據,RR的計算過程如下

吸煙組患肺癌的比例 a / (a + b)

不吸煙組患肺癌的比例 c / (c + d)

RR = (a / (a + b)) /( c / (c + d))

RR的數值大小直觀的反映了暴露因素中發病率的大小,RR>1, 暴露組中發病率大於非暴露組的發病率,說明暴露因素和發病率是正相關關係,反之,RR<1, 暴露組中發病率小於非暴露組的發病率,說明暴露因素和發病率是父相關關係。如果RR = 1, 兩組發病率相等,說明暴露因素和發病率沒有關聯。

值得一提的是,在計算過程中使用了抽樣數據的頻率來代表發病的概率,這個只有當抽樣數目非常大才適用, 所以RR值適用於大規模的隊列樣本。對於常規的case/control研究,其抽樣的數目都達不到這樣的規模。所以不能直接用上述公式來計算RR,進一步提出了odd ratio的概念。

對於罕見疾病,患病的個體數量遠小於正常組的數量,出於這樣的考慮,將上述模型做一個簡化處理,a + b 的值用b里表示,c + d的值有d 來表示,因為a遠小於b, c遠小於d, 幾乎可以忽略不計,此時上述公式就變成了

(a / b) / (c / d) = (a d) /( b c)

這個公式計算出的結果就是odd ratio, 簡稱OR, 也叫做優勢比,交叉乘積比等。從上述轉換可以看出來,OR其實是RR的一個估計值,其含義和RR值相同。 通過OR值來定量描述關聯性的大小, 使得我們可以直觀比較不同因素和疾病之間關聯性的強弱,有助於篩選強關聯的因素。

·end·